प्रमुख LLM चैट टूल्स पर Reddit उपयोगकर्ता प्रतिक्रिया
सारांश: यह रिपोर्ट चार लोकप्रिय AI चैट टूल्स – OpenAI का ChatGPT, Anthropic का Claude, Google का Gemini (Bard), और ओपन-सोर्स LLMs (जैसे LLaMA-आधारित मॉडल) पर Reddit चर्चाओं का विश्लेषण करती है। यह प्रत्येक के लिए उपयोगकर्ताओं द्वारा रिपोर्ट की गई सामान्य समस्याओं का सारांश प्रस्तुत करती है, वे सुविधाएँ जो वे सबसे अधिक बार अनुरोध करते हैं, अपूर्ण आवश्यकताएँ या उपयोगकर्ता खंड जो उपेक्षित महसूस करते हैं, और डेवलपर्स, आकस्मिक उपयोगकर्ताओं और व्यावसायिक उपयोगकर्ताओं के बीच धारणा में अंतर। इन बिंदुओं को स्पष्ट करने के लिए Reddit थ्रेड्स से विशिष्ट उदाहरण और उद्धरण शामिल हैं।
ChatGPT (OpenAI)
सामान्य समस्याएँ और सीमाएँ
-
सीमित संदर्भ स्मृति: एक शीर्ष शिकायत है कि ChatGPT लंबी बातचीत या बड़े दस्तावेज़ों को बिना पहले के विवरण भूलने के संभालने में असमर्थ है। उपयोगकर्ता अक्सर संदर्भ लंबाई सीमा (कुछ हजार टोकन) तक पहुँचते हैं और उन्हें जानकारी को संक्षिप्त या सारांशित करना पड़ता है। एक उपयोगकर्ता ने उल्लेख किया “संदर्भ विंडो का आकार बढ़ाना सबसे बड़ा सुधार होगा... यही वह सीमा है जिसका मैं सबसे अधिक सामना करता हूँ”। जब संदर्भ पार हो जाता है, तो ChatGPT प्रारंभिक निर्देशों या सामग्री को भूल जाता है, जिससे सत्र के मध्य में गुणवत्ता में निराशाजनक गिरावट आती है।
-
GPT-4 के लिए संदेश कैप्स: ChatGPT Plus उपयोगकर्ता GPT-4 उपयोग के 25-संदेश/3-घंटे की सीमा (2023 में मौजूद सीमा) की शिकायत करते हैं। इस सीमा को पार करने से उन्हें प्रतीक्षा करनी पड़ती है, जिससे काम में बाधा आती है। भारी उपयोगकर्ता इस थ्रॉटलिंग को एक प्रमुख समस्या मानते हैं।
-
कठोर सामग्री फ़िल्टर ("नरफ्स"): कई Reddit उपयोगकर्ता महसूस करते हैं कि ChatGPT अत्यधिक प्रतिबंधात्मक हो गया है, अक्सर उन अनुरोधों को अस्वीकार कर देता है जिन्हें पहले के संस्करणों ने संभाला था। एक अत्यधिक अपवोटेड पोस्ट ने शिकायत की कि “आजकल आप जो कुछ भी पूछते हैं, वह 'माफ़ करें, मदद नहीं कर सकता' लौटाता है... यह सबसे उपयोगी टूल से Google सहायक के समकक्ष कैसे हो गया?”। उपयोगकर्ता उदाहरण देते हैं जैसे कि ChatGPT उनके अपने टेक्स्ट (जैसे लॉगिन क्रेडेंशियल्स) को पुनः स्वरूपित करने से इंकार कर देता है क्योंकि इसका दुरुपयोग हो सकता है। भुगतान करने वाले ग्राहक तर्क देते हैं कि “कुछ अस्पष्ट धारणा कि उपयोगकर्ता 'बुरा' काम कर सकता है... परिणाम प्रदर्शित न करने का आधार नहीं होना चाहिए”, क्योंकि वे मॉडल के आउटपुट चाहते हैं और इसे जिम्मेदारी से उपयोग करेंगे।
-
भ्रम और त्रुटियाँ: अपनी उन्नत क्षमता के बावजूद, ChatGPT आत्मविश्वास के साथ गलत या गढ़ी हुई जानकारी उत्पन्न कर सकता है। कुछ उपयोगकर्ताओं ने देखा है कि समय के साथ यह बदतर हो गया है, संदेह है कि मॉडल को "मूर्ख" बनाया गया था। उदाहरण के लिए, वित्त में एक उपयोगकर्ता ने कहा कि ChatGPT पहल े NPV या IRR जैसे मेट्रिक्स को सही ढंग से गणना करता था, लेकिन अपडेट के बाद “मुझे इतने सारे गलत उत्तर मिल रहे हैं... यह अभी भी गलत उत्तर उत्पन्न करता है [सुधार के बाद भी]। मुझे वास्तव में विश्वास है कि परिवर्तनों के बाद यह बहुत मूर्ख हो गया है।”। इस तरह की अप्रत्याशित गलतियाँ उन कार्यों के लिए विश्वास को कम करती हैं जिनके लिए तथ्यात्मक सटीकता की आवश्यकता होती है।
-
अपूर्ण कोड आउटपुट: डेवलपर्स अक्सर कोडिंग सहायता के लिए ChatGPT का उपयोग करते हैं, लेकिन वे रिपोर्ट करते हैं कि यह कभी-कभी समाधान के कुछ हिस्सों को छोड़ देता है या लंबे कोड को काट देता है। एक उपयोगकर्ता ने साझा किया कि ChatGPT अब “कोड छोड़ देता है, अनुपयोगी कोड उत्पन्न करता है, और जिस चीज़ की मुझे आवश्यकता है उसमें बस बेकार है... यह अक्सर इतना कोड छोड़ देता है कि मैं यह भी नहीं जानता कि इसके समाधान को कैसे एकीकृत किया जाए।” यह उपयोगकर्ताओं को शेष को बाहर निकालने के लिए अनुवर्ती संकेत देने के लिए मजबूर करता है, या उत्तरों को मैन्युअल रूप से जोड़ने के लिए मजबूर करता है - एक थकाऊ प्रक्रिया।
-
प्रदर्शन और अपटाइम चिंताएँ: यह धारणा है कि जैसे-जैसे एंटरप्राइज़ उपयोग बढ़ा, व्यक्तिगत उपयोगकर्ताओं के लिए ChatGPT का प्रदर्शन घट गया। “मुझे लगता है कि वे बैंडविड्थ और प्रोसेसिंग पावर को व्यवसायों को आवंटित कर रहे हैं और इसे उपयोगकर्ताओं से दूर कर रहे हैं, जो कि सदस्यता की लागत को देखते हुए असहनीय है!” एक निराश प्लस ग्राहक ने कहा। चरम समय के दौरान आउटेज या मंदी का उल्लेख किया गया है, जो वर्कफ़्लो को बाधित कर सकता है।
अक्सर अनुरोधित सुविधाएँ या सुधार
-
लंबा संदर्भ विंडो / मेमोरी: अब तक का सबसे अनुरोधित सुधार बड़ा संदर्भ लंबाई है। उपयोगकर्ता बहुत लंबी बातचीत करना चाहते हैं या बिना रीसेट के बड़े दस्तावेज़ फ़ीड करना चाहते हैं। कई लोग सुझाव देते हैं कि ChatGPT के संदर्भ को GPT-4 की 32K टोकन क्षमता (वर्तमान में API के माध्यम से उपलब्ध) या उससे आगे तक विस्तारित किया जाए। जैसा कि एक उपयोगकर्ता ने कहा, “GPT संदर्भ के साथ सबसे अच्छा है, और जब यह उस प्रारंभिक संदर्भ को याद नहीं रखता है, तो मुझे निराशा होती है... अगर अफवाहें सच हैं कि संदर्भ पीडीएफ, तो यह मूल रूप से मेरी सभी समस्याओं का समाधान करेगा।” दस्तावेज़ अपलोड करने या व्यक्तिगत डेटा लिंक करने की सुविधाओं की उच्च मांग है ताकि ChatGPT सत्र के दौरान उन्हें याद रख सके और संदर्भित कर सके।
-
फाइल-हैंडलिंग और एकीकरण: उपयोगकर् ता अक्सर ChatGPT में फ़ाइलें या डेटा फ़ीड करने के आसान तरीकों के लिए कहते हैं। चर्चाओं में, लोग “मेरे Google ड्राइव को कॉपी और पेस्ट करना और इसे काम करना” या ऐसे प्लगइन्स चाहते हैं जो ChatGPT को सीधे व्यक्तिगत फ़ाइलों से संदर्भ प्राप्त करने दें। कुछ ने वर्कअराउंड आज़माए हैं (जैसे पीडीएफ रीडर प्लगइन्स या Google डॉक्स लिंक करना), लेकिन त्रुटियों और सीमाओं के बारे में शिकायत की। एक उपयोगकर्ता ने अपने आदर्श प्लगइन का वर्णन किया जो “लिंक रीडर की तरह काम करता है लेकिन व्यक्तिगत फ़ाइलों के लिए... बातचीत में मेरे ड्राइव के किन हिस्सों का उपयोग करना है चुनना... यह मूल रूप से मेरी GPT-4 के साथ वर्तमान में सभी समस्याओं का समाधान करेगा।”। संक्षेप में, बाहरी ज्ञान के लिए बेहतर देशी समर्थन (प्रशिक्षण डेटा से परे) एक लोकप्रिय अनुरोध है।
-
भुगतान किए गए उपयोगकर्ताओं के लिए कम थ्रॉटलिंग: चूंकि कई प्ल स उपयोगकर्ता GPT-4 संदेश सीमा तक पहुँचते हैं, वे उच्च सीमाओं या असीमित पहुंच के लिए अधिक भुगतान करने के विकल्प के लिए कहते हैं। 25-संदेश सीमा को मनमाना और गहन उपयोग में बाधा डालने वाला माना जाता है। लोग उपयोग-आधारित मॉडल या उच्च सीमा पसंद करेंगे ताकि लंबे समस्या-समाधान सत्रों को बीच में न काटा जाए।
-
"अनसेंसर्ड" या कस्टम मॉडरेशन मोड: उपयोगकर्ताओं का एक खंड सामग्री फ़िल्टर की कठोरता को टॉगल करने की क्षमता चाहता है, विशेष रूप से जब वे ChatGPT का उपयोग स्वयं के लिए कर रहे हों (सार्वजनिक-सामना करने वाली सामग्री नहीं)। वे महसूस करते हैं कि एक "अनुसंधान" या "अनसेंसर्ड" मोड - चेतावनियों के साथ लेकिन कठिन अस्वीकृति के बिना - उन्हें अधिक स्वतंत्र रूप से अन्वेषण करने देगा। जैसा कि एक उपयोगकर्ता ने कहा, भुगतान करने वाले ग्राहक इसे एक उपकरण के रूप में देखते हैं और विश्वास करते हैं