प्रमुख LLM चैट टूल्स पर Reddit उपयोगकर्ता प्रतिक्रिया
सारांश: यह रिपोर्ट चार लोकप्रिय AI चैट टूल्स – OpenAI का ChatGPT, Anthropic का Claude, Google का Gemini (Bard), और ओपन-सोर्स LLMs (जैसे LLaMA-आधारित मॉडल) पर Reddit चर्चाओं का विश्लेषण करती है। यह प्रत्येक के लिए उपयोगकर्ताओं द्वारा रिपोर्ट की गई सामान्य समस्याओं का सारांश प्रस्तुत करती है, वे सुविधाएँ जो वे सबसे अधिक बार अनुरोध करते हैं, अपूर्ण आवश्यकताएँ या उपयोगकर्ता खंड जो उपेक्षित महसूस करते हैं, और डेवलपर्स, आकस्मिक उपयोगकर्ताओं और व्यावसायिक उपयोगकर्ताओं के बीच धारणा में अंतर। इन बिंदुओं को स्पष्ट करने के लिए Reddit थ्रेड्स से विशिष्ट उदाहरण और उद्धरण शामिल हैं।
ChatGPT (OpenAI)
सामान्य समस्याएँ और सीमाएँ
-
सीमित संदर्भ स्मृति: एक शीर्ष शिकायत है कि ChatGPT लंबी बातचीत या बड़े दस्तावेज़ों को बिना पहले के विवरण भूलने के संभालने में असमर्थ है। उपयोगकर्ता अक्सर संदर्भ लंबाई सीमा (कुछ हजार टोकन) तक पहुँचते हैं और उन्हें जानकारी को संक्षिप्त या सारांशित करना पड़ता है। ए क उपयोगकर्ता ने उल्लेख किया “संदर्भ विंडो का आकार बढ़ाना सबसे बड़ा सुधार होगा... यही वह सीमा है जिसका मैं सबसे अधिक सामना करता हूँ”। जब संदर्भ पार हो जाता है, तो ChatGPT प्रारंभिक निर्देशों या सामग्री को भूल जाता है, जिससे सत्र के मध्य में गुणवत्ता में निराशाजनक गिरावट आती है।
-
GPT-4 के लिए संदेश कैप्स: ChatGPT Plus उपयोगकर्ता GPT-4 उपयोग के 25-संदेश/3-घंटे की सीमा (2023 में मौजूद सीमा) की शिकायत करते हैं। इस सीमा को पार करने से उन्हें प्रतीक्षा करनी पड़ती है, जिससे काम में बाधा आती है। भारी उपयोगकर्ता इस थ्रॉटलिंग को एक प्रमुख समस्या मानते हैं।
-
कठोर सामग्री फ़िल्टर ("नरफ्स"): कई Reddit उपयोगकर्ता महसूस करते हैं कि ChatGPT अत्यधिक प्रतिबंधात्मक हो गया है, अक्सर उन अनुरोधों को अस्वीकार कर देता है जिन्हें पहले के संस्करणों ने संभाला था। एक अत्यधिक अपवोटेड पोस्ट ने शिकायत की कि “आजक ल आप जो कुछ भी पूछते हैं, वह 'माफ़ करें, मदद नहीं कर सकता' लौटाता है... यह सबसे उपयोगी टूल से Google सहायक के समकक्ष कैसे हो गया?”। उपयोगकर्ता उदाहरण देते हैं जैसे कि ChatGPT उनके अपने टेक्स्ट (जैसे लॉगिन क्रेडेंशियल्स) को पुनः स्वरूपित करने से इंकार कर देता है क्योंकि इसका दुरुपयोग हो सकता है। भुगतान करने वाले ग्राहक तर्क देते हैं कि “कुछ अस्पष्ट धारणा कि उपयोगकर्ता 'बुरा' काम कर सकता है... परिणाम प्रदर्शित न करने का आधार नहीं होना चाहिए”, क्योंकि वे मॉडल के आउटपुट चाहते हैं और इसे जिम्मेदारी से उपयोग करेंगे।
-
भ्रम और त्रुटियाँ: अपनी उन्नत क्षमता के बावजूद, ChatGPT आत्मविश्वास के साथ गलत या गढ़ी हुई जानकारी उत्पन्न कर सकता है। कुछ उपयोगकर्ताओं ने देखा है कि समय के साथ यह बदतर हो गया है, संदेह है कि मॉडल को "मूर्ख" बनाया गया था। उदाहरण के लिए, वित्त में एक उपयोगकर्ता ने कहा कि ChatGPT पहले NPV या IRR जैसे मेट्रिक्स को सही ढंग से गणना करता था, लेकिन अपडेट के बाद “मुझे इतने सारे गलत उत्तर मिल रहे हैं... यह अभी भी गलत उत्तर उत्पन्न करता है [सुधार के बाद भी]। मुझे वास्तव में विश्वास है कि परिवर्तनों के बाद यह बहुत मूर्ख हो गया है।”। इस तरह की अप्रत्याशित गलतियाँ उन कार्यों के लिए विश्वास को कम करती हैं जिनके लिए तथ्यात्मक सटीकता की आवश्यकता होती है।
-
अपूर्ण कोड आउटपुट: डेवलपर्स अक्सर कोडिंग सहायता के लिए ChatGPT का उपयोग करते हैं, लेकिन वे रिपोर्ट करते हैं कि यह कभी-कभी समाधान के कुछ हिस्सों को छोड़ देता है या लंबे कोड को काट देता है। एक उपयोगकर्ता ने साझा किया कि ChatGPT अब “कोड छोड़ देता है, अनुपयोगी कोड उत्पन्न करता है, और जिस चीज़ की मुझे आवश्यकता है उसमें बस बेकार है... यह अक्सर इतना कोड छोड़ देता है कि मैं यह भी नहीं जानता कि इसके समाधान को कैसे एकीकृत कि या जाए।” यह उपयोगकर्ताओं को शेष को बाहर निकालने के लिए अनुवर्ती संकेत देने के लिए मजबूर करता है, या उत्तरों को मैन्युअल रूप से जोड़ने के लिए मजबूर करता है - एक थकाऊ प्रक्रिया।
-
प्रदर्शन और अपटाइम चिंताएँ: यह धारणा है कि जैसे-जैसे एंटरप्राइज़ उपयोग बढ़ा, व्यक्तिगत उपयोगकर्ताओं के लिए ChatGPT का प्रदर्शन घट गया। “मुझे लगता है कि वे बैंडविड्थ और प्रोसेसिंग पावर को व्यवसायों को आवंटित कर रहे हैं और इसे उपयोगकर्ताओं से दूर कर रहे हैं, जो कि सदस्यता की लागत को देखते हुए असहनीय है!” एक निराश प्लस ग्राहक ने कहा। चरम समय के दौरान आउटेज या मंदी का उल्लेख किया गया है, जो वर्कफ़्लो को बाधित कर सकता है।