ข้ามไปยังเนื้อหาหลัก

โพสต์หนึ่งโพสต์ แท็กด้วย "แชทบอท"

ดูแท็กทั้งหมด

LLM กำลังกำหนดนิยามใหม่ของการสนทนาและทิศทางต่อไปของเราได้อย่างไร

· อ่านหนึ่งนาที
Lark Birdy
Chief Bird Officer

Large Language Models (LLMs) เช่น ChatGPT, Gemini และ Claude ไม่ใช่แค่แนวคิดแห่งอนาคตอีกต่อไป แต่กำลังขับเคลื่อนเครื่องมือสนทนารูปแบบใหม่ที่กำลังเปลี่ยนแปลงวิธีการเรียนรู้ การทำงาน การซื้อของ และแม้กระทั่งการดูแลความเป็นอยู่ที่ดีของเรา ปัญญาประดิษฐ์ที่น่าทึ่งเหล่านี้สามารถสนทนาได้อย่างเป็นธรรมชาติเหมือนมนุษย์ เข้าใจความตั้งใจ และสร้างข้อความที่ลึกซึ้ง เปิดโลกแห่งความเป็นไปได้ใหม่ๆ

LLM กำลังพลิกโฉมการสนทนา และก้าวต่อไปของเรา

ตั้งแต่ติวเตอร์ส่วนตัวที่ปรับให้เข้ากับสไตล์การเรียนรู้ของแต่ละบุคคล ไปจนถึงตัวแทนบริการลูกค้าที่ไม่รู้จักเหน็ดเหนื่อย LLM กำลังถูกถักทอเข้ากับชีวิตดิจิทัลของเรา แต่ในขณะที่ความสำเร็จนั้นน่าประทับใจ การเดินทางยังอีกยาวไกล มาสำรวจภูมิทัศน์ปัจจุบันของโซลูชันที่ใช้การสนทนาเหล่านี้ ทำความเข้าใจว่าอะไรทำให้มันทำงานได้ ระบุช่องว่างที่ยังคงมีอยู่ และค้นพบโอกาสที่น่าตื่นเต้นที่รออยู่ข้างหน้า

LLMs ในการปฏิบัติ: พลิกโฉมอุตสาหกรรมด้วยการสนทนาทีละครั้ง

ผลกระทบของ LLMs กำลังแพร่หลายในหลากหลายภาคส่วน:

1. การศึกษาและการเรียนรู้: การมาถึงของ AI ติวเตอร์

การศึกษาได้เปิดรับการสนทนาที่ขับเคลื่อนด้วย LLM อย่างกระตือรือร้น

  • Khanmigo ของ Khan Academy (ขับเคลื่อนโดย GPT-4) ทำหน้าที่เป็นโสกราตีสเสมือนจริง โดยนำพานักเรียนผ่านปัญหาด้วยคำถามที่กระตุ้นความคิดมากกว่าการให้คำตอบโดยตรง ซึ่งส่งเสริมความเข้าใจที่ลึกซึ้งยิ่งขึ้น นอกจากนี้ยังช่วยครูในการวางแผนบทเรียนอีกด้วย
  • Duolingo Max ใช้ประโยชน์จาก GPT-4 สำหรับคุณสมบัติต่างๆ เช่น "Roleplay" (ฝึกสนทนาในสถานการณ์จริงกับ AI) และ "Explain My Answer" (ให้ข้อเสนอแนะด้านไวยากรณ์และคำศัพท์ที่ปรับให้เหมาะกับแต่ละบุคคล) ซึ่งช่วยแก้ไขช่องว่างสำคัญในการเรียนรู้ภาษา
  • Q-Chat ของ Quizlet (แม้ว่ารูปแบบเริ่มต้นจะกำลังพัฒนาอยู่) มีเป้าหมายที่จะทดสอบนักเรียนในลักษณะโสกราตีส AI ของพวกเขายังช่วยสรุปข้อความและสร้างสื่อการเรียนรู้
  • CheggMate ซึ่งเป็นคู่หูการเรียนรู้ที่ขับเคลื่อนด้วย GPT-4 ได้รวมเข้ากับคลังเนื้อหาของ Chegg เพื่อนำเสนอเส้นทางการเรียนรู้ที่ปรับให้เหมาะกับแต่ละบุคคลและการแก้ปัญหาแบบทีละขั้นตอน

เครื่องมือเหล่านี้มีเป้าหมายเพื่อปรับการเรียนรู้ให้เป็นส่วนตัวและทำให้ความช่วยเหลือตามความต้องการน่าสนใจยิ่งขึ้น

2. การสนับสนุนและบริการลูกค้า: การแก้ไขปัญหาที่ฉลาดขึ้นและรวดเร็วขึ้น

LLMs กำลังปฏิวัติการบริการลูกค้าโดยเปิดใช้งานการสนทนาที่เป็นธรรมชาติและหลายรอบ ซึ่งสามารถแก้ไขคำถามได้หลากหลายยิ่งขึ้น

  • Fin ของ Intercom (อิงตาม GPT-4) เชื่อมต่อกับฐานความรู้ของบริษัทเพื่อตอบคำถามลูกค้าในลักษณะการสนทนา ซึ่งช่วยลดปริมาณการสนับสนุนได้อย่างมากโดยการจัดการปัญหาทั่วไปได้อย่างมีประสิทธิภาพ
  • Zendesk ใช้ "AI แบบตัวแทน" โดยใช้โมเดลอย่าง GPT-4 ร่วมกับ Retrieval-Augmented Generation ซึ่งตัวแทน LLM เฉพาะทางหลายตัวทำงานร่วมกันเพื่อทำความเข้าใจเจตนา ดึงข้อมูล และแม้กระทั่งดำเนินการแก้ไขปัญหา เช่น การประมวลผลการคืนเงิน
  • แพลตฟอร์มอย่าง Salesforce (Einstein GPT) และ Slack (แอป ChatGPT) กำลังฝัง LLMs เพื่อช่วยตัวแทนสนับสนุนสรุปเธรด ค้นหาความรู้ภายใน และร่างการตอบกลับ ซึ่งช่วยเพิ่มประสิทธิภาพการทำงาน

เป้าหมายคือการสนับสนุนตลอด 24 ชั่วโมงทุกวัน ที่เข้าใจภาษาและความตั้งใจของลูกค้า ทำให้ตัวแทนที่เป็นมนุษย์มีเวลาสำหรับกรณีที่ซับซ้อน

3. เครื่องมือเพิ่มประสิทธิภาพและเครื่องมือในที่ทำงาน: AI ผู้ช่วยส่วนตัวของคุณในการทำงาน

ผู้ช่วย AI กำลังกลายเป็นส่วนสำคัญของเครื่องมือระดับมืออาชีพในชีวิตประจำวัน

  • Microsoft 365 Copilot (รวม GPT-4 เข้ากับ Word, Excel, PowerPoint, Outlook, Teams) ช่วยร่างเอกสาร วิเคราะห์ข้อมูลด้วยการสอบถามภาษาธรรมชาติ สร้างงานนำเสนอ สรุปอีเมล และแม้กระทั่งสรุปการประชุมพร้อมรายการดำเนินการ
  • Duet AI ของ Google Workspace นำเสนอความสามารถที่คล้ายกันใน Google Docs, Gmail, Sheets และ Meet
  • Notion AI ช่วยในการเขียน สรุป และระดมสมองได้โดยตรงภายในพื้นที่ทำงานของ Notion
  • ผู้ช่วยเขียนโค้ดอย่าง GitHub Copilot และ Amazon CodeWhisperer ใช้ LLMs เพื่อแนะนำโค้ดและเร่งความเร็วในการพัฒนา

เครื่องมือเหล่านี้มีเป้าหมายที่จะทำให้ "งานยุ่ง" เป็นไปโดยอัตโนมัติ ทำให้ผู้เชี่ยวชาญสามารถมุ่งเน้นไปที่งานหลักได้

4. สุขภาพจิตและสุขภาวะ: ผู้ฟังที่เข้าใจ (ดิจิทัล)

LLMs กำลังปรับปรุงแชทบอทด้านสุขภาพจิต ทำให้เป็นธรรมชาติและเป็นส่วนตัวมากขึ้น พร้อมทั้งคำนึงถึงข้อควรพิจารณาด้านความปลอดภัยที่สำคัญ

  • แอปอย่าง Wysa และ Woebot กำลังผสานรวม LLMs อย่างระมัดระวัง เพื่อก้าวข้ามเทคนิคการบำบัดพฤติกรรมทางปัญญา (CBT) ที่เป็นสคริปต์ โดยนำเสนอการสนับสนุนการสนทนาที่ยืดหยุ่นและเห็นอกเห็นใจมากขึ้นสำหรับความเครียดในชีวิตประจำวันและการจัดการอารมณ์
  • Replika ซึ่งเป็นแอป AI เพื่อนคู่คิด ใช้ LLMs เพื่อสร้าง "เพื่อน" ส่วนตัวที่สามารถสนทนาแบบปลายเปิดได้ ซึ่งมักจะช่วยผู้ใช้ต่อสู้กับความเหงา

เครื่องมือเหล่านี้ให้การสนับสนุนที่เข้าถึงได้ตลอด 24 ชั่วโมงทุกวัน และไม่ตัดสินใคร แม้ว่าพวกเขาจะวางตำแหน่งตัวเองเป็นโค้ชหรือเพื่อนร่วมทาง ไม่ใช่สิ่งทดแทนการดูแลทางคลินิก

5. อีคอมเมิร์ซและการค้าปลีก: AI ผู้ช่วยช้อปปิ้งส่วนตัว

LLMs ที่ใช้การแชทกำลังทำให้การช้อปปิ้งออนไลน์มีการโต้ตอบและเป็นส่วนตัวมากขึ้น

  • แอป Shop ของ Shopify มีผู้ช่วยที่ขับเคลื่อนด้วย ChatGPT ซึ่งนำเสนอคำแนะนำผลิตภัณฑ์ที่ปรับให้เหมาะกับแต่ละบุคคลตามการสอบถามและประวัติของผู้ใช้ เลียนแบบประสบการณ์ในร้านค้า Shopify ยังมีเครื่องมือ AI สำหรับผู้ค้าในการสร้างคำอธิบายผลิตภัณฑ์และข้อความทางการตลาด
  • ปลั๊กอิน ChatGPT ของ Instacart ช่วยในการวางแผนมื้ออาหารและการซื้อของชำผ่านการสนทนา
  • ปลั๊กอินของ Klarna สำหรับ ChatGPT ทำหน้าที่เป็นเครื่องมือค้นหาและเปรียบเทียบผลิตภัณฑ์
  • AI ยังถูกใช้เพื่อสรุปรีวิวลูกค้าจำนวนมากให้เป็นข้อดีข้อเสียที่กระชับ ช่วยให้ผู้ซื้อตัดสินใจได้เร็วขึ้น

ผู้ช่วย AI เหล่านี้แนะนำลูกค้า ตอบคำถาม และปรับแต่งคำแนะนำ โดยมีเป้าหมายเพื่อเพิ่มยอดขายและความพึงพอใจ

โครงสร้างของความสำเร็จ: อะไรที่ทำให้เครื่องมือแชท LLM มีประสิทธิภาพ?

ในการใช้งานที่หลากหลายเหล่านี้ ส่วนประกอบสำคัญหลายประการมีส่วนช่วยให้โซลูชันแชทที่ขับเคลื่อนด้วย LLM มีประสิทธิภาพ:

  • ความเข้าใจภาษาขั้นสูง: LLM ที่ล้ำสมัยสามารถตีความข้อมูลที่ซับซ้อนและอิสระจากผู้ใช้ และตอบสนองได้อย่างคล่องแคล่วและเหมาะสมกับบริบท ทำให้การโต้ตอบรู้สึกเป็นธรรมชาติ
  • การบูรณาการความรู้เฉพาะทาง: การอ้างอิงคำตอบของ LLM ด้วยฐานข้อมูลที่เกี่ยวข้อง, เนื้อหาเฉพาะของบริษัท, หรือข้อมูลแบบเรียลไทม์ (บ่อยครั้งผ่าน Retrieval-Augmented Generation) ช่วยเพิ่มความแม่นยำและประโยชน์ใช้สอยได้อย่างมาก
  • การมุ่งเน้นปัญหา/ความต้องการที่ชัดเจน: เครื่องมือที่ประสบความสำเร็จจะมุ่งเป้าไปที่ปัญหาที่แท้จริงของผู้ใช้ และปรับบทบาทของ AI เพื่อแก้ไขปัญหาเหล่านั้นได้อย่างมีประสิทธิภาพ แทนที่จะใช้ AI เพียงเพื่อตัวมันเอง
  • ประสบการณ์ผู้ใช้ (UX) ที่ราบรื่น: การฝังความช่วยเหลือจาก AI เข้าสู่ขั้นตอนการทำงานและแพลตฟอร์มที่มีอยู่ได้อย่างราบรื่น พร้อมด้วยการออกแบบที่ใช้งานง่ายและการควบคุมของผู้ใช้ ช่วยเพิ่มการนำไปใช้และประโยชน์ใช้สอย
  • ความน่าเชื่อถือและความปลอดภัยทางเทคนิค: การใช้มาตรการเพื่อยับยั้งการสร้างข้อมูลที่ผิดพลาด (hallucinations), เนื้อหาที่ไม่เหมาะสม และข้อผิดพลาด—เช่น การปรับแต่ง (fine-tuning), ระบบป้องกัน (guardrail systems), และตัวกรองเนื้อหา—เป็นสิ่งสำคัญสำหรับการสร้างความไว้วางใจของผู้ใช้
  • ความพร้อมของตลาดและคุณค่าที่รับรู้: เครื่องมือเหล่านี้ตอบสนองความคาดหวังของผู้ใช้ที่เพิ่มขึ้นสำหรับซอฟต์แวร์ที่ชาญฉลาดมากขึ้น โดยมอบประโยชน์ที่จับต้องได้ เช่น การประหยัดเวลาหรือความสามารถที่เพิ่มขึ้น

พิจารณาช่องว่าง: ความต้องการที่ยังไม่ได้รับการตอบสนองในภูมิทัศน์การสนทนาของ LLM

แม้จะมีความก้าวหน้าอย่างรวดเร็ว แต่ก็ยังคงมีช่องว่างที่สำคัญและความต้องการที่ยังไม่ได้รับการตอบสนองอยู่:

  • ความน่าเชื่อถือของข้อเท็จจริงและความไว้วางใจ: ปัญหา "การสร้างข้อมูลเท็จ" (hallucination) ยังคงมีอยู่ สำหรับโดเมนที่มีความเสี่ยงสูง เช่น การแพทย์ กฎหมาย หรือการเงิน ระดับความถูกต้องของข้อเท็จจริงในปัจจุบันไม่เพียงพอเสมอไปสำหรับแชทบอทที่หันหน้าเข้าหาผู้บริโภคที่เชื่อถือได้และทำงานได้ด้วยตนเองอย่างเต็มที่
  • การจัดการงานที่ซับซ้อนและเฉพาะทาง: แม้จะเป็นผู้เชี่ยวชาญทั่วไปที่ยอดเยี่ยม แต่ LLM อาจประสบปัญหาในการวางแผนหลายขั้นตอน การใช้เหตุผลเชิงวิพากษ์อย่างลึกซึ้ง หรือการสอบถามที่เฉพาะเจาะจงมาก ๆ และเป็นเฉพาะกลุ่ม ซึ่งต้องใช้หน่วยความจำจำนวนมากหรือการเชื่อมต่อกับระบบภายนอกจำนวนมาก
  • การปรับแต่งส่วนบุคคลอย่างลึกซึ้งและหน่วยความจำระยะยาว: เครื่องมือแชทส่วนใหญ่ขาดหน่วยความจำระยะยาวที่แข็งแกร่ง ซึ่งหมายความว่าพวกเขาไม่ "รู้จัก" ผู้ใช้จริง ๆ ในระยะเวลานาน การปรับแต่งส่วนบุคคลที่มีประสิทธิภาพมากขึ้นโดยอิงจากประวัติการโต้ตอบระยะยาวเป็นคุณสมบัติที่เป็นที่ต้องการ
  • การรองรับหลายรูปแบบและการโต้ตอบที่ไม่ใช่ข้อความ: เครื่องมือส่วนใหญ่เป็นแบบข้อความ มีความต้องการเพิ่มขึ้นสำหรับ AI การสนทนาที่ใช้เสียงที่ซับซ้อนและการรวมความเข้าใจด้านภาพที่ดีขึ้น (เช่น การสนทนาเกี่ยวกับรูปภาพที่อัปโหลด)
  • การรองรับภาษาท้องถิ่นและภาษาที่หลากหลาย: เครื่องมือ LLM คุณภาพสูงส่วนใหญ่เน้นภาษาอังกฤษเป็นหลัก ทำให้ประชากรทั่วโลกจำนวนมากไม่ได้รับการบริการที่ดีพอจาก AI ที่ขาดความคล่องแคล่วหรือบริบททางวัฒนธรรมในภาษาแม่ของพวกเขา
  • อุปสรรคด้านต้นทุนและการเข้าถึง: LLM ที่ทรงพลังที่สุดมักจะอยู่หลังกำแพงการชำระเงิน ซึ่งอาจทำให้ช่องว่างทางดิจิทัลกว้างขึ้น จำเป็นต้องมีโซลูชันที่เข้าถึงได้ง่ายหรือเปิดให้ใช้งานสำหรับประชากรในวงกว้าง
  • โดเมนเฉพาะที่ขาดโซลูชันที่ปรับแต่ง: สาขาเฉพาะกลุ่มแต่สำคัญ เช่น การวิจัยทางกฎหมายเฉพาะทาง การค้นพบทางวิทยาศาสตร์ หรือการฝึกสอนศิลปะสร้างสรรค์ระดับผู้เชี่ยวชาญ ยังคงขาดแอปพลิเคชัน LLM ที่ปรับแต่งอย่างลึกซึ้งและเชื่อถือได้สูง

คว้าโอกาส: โอกาส "ที่ทำได้ง่าย" ที่มีศักยภาพสูง

ด้วยความสามารถของ LLM ในปัจจุบัน แอปพลิเคชันที่ค่อนข้างเรียบง่ายแต่มีผลกระทบสูงหลายรายการสามารถดึงดูดฐานผู้ใช้จำนวนมากได้:

  1. เครื่องมือสรุปวิดีโอ/YouTube: เครื่องมือที่ช่วยสรุปเนื้อหาได้อย่างกระชับ หรือตอบคำถามเกี่ยวกับเนื้อหาวิดีโอโดยใช้สคริปต์ จะมีคุณค่าอย่างยิ่งสำหรับทั้งนักเรียนและมืออาชีพ
  2. เครื่องมือปรับปรุงเรซูเม่และจดหมายสมัครงาน: ผู้ช่วย AI ที่ช่วยผู้หางานร่าง ปรับแต่ง และเพิ่มประสิทธิภาพเรซูเม่และจดหมายสมัครงานสำหรับตำแหน่งงานที่เฉพาะเจาะจง
  3. เครื่องมือสรุปอีเมลส่วนตัวและร่างข้อความตอบกลับ: เครื่องมือขนาดเล็ก (อาจเป็นส่วนขยายของเบราว์เซอร์) เพื่อสรุปชุดอีเมลยาว ๆ และร่างข้อความตอบกลับสำหรับบุคคลทั่วไปที่ไม่ได้ใช้ชุดโปรแกรมองค์กรขนาดใหญ่
  4. บอทถาม-ตอบเพื่อการเรียนรู้ส่วนบุคคล: แอปที่ช่วยให้นักเรียนสามารถอัปโหลดข้อความใด ๆ (บทเรียนในตำราเรียน, บันทึกย่อ) และสามารถ "สนทนา" กับมันได้—ถามคำถาม รับคำอธิบาย หรือถูกทดสอบความรู้จากเนื้อหานั้น
  5. เครื่องมือปรับปรุงเนื้อหาด้วย AI สำหรับครีเอเตอร์: ผู้ช่วยสำหรับบล็อกเกอร์, ยูทูบเบอร์ และผู้จัดการโซเชียลมีเดีย เพื่อนำเนื้อหาแบบยาวมาปรับใช้ในรูปแบบต่าง ๆ (โพสต์โซเชียล, สรุป, โครงร่าง) หรือปรับปรุงให้ดีขึ้น

แนวคิดเหล่านี้ใช้ประโยชน์จากจุดแข็งหลักของ LLM—การสรุป, การสร้าง, การถาม-ตอบ—และแก้ไขปัญหาที่พบบ่อย ทำให้พร้อมสำหรับการพัฒนา

สร้างอนาคต: ด้วยการใช้ประโยชน์จาก LLM API ที่เข้าถึงได้

ส่วนที่น่าตื่นเต้นสำหรับนักพัฒนาที่ต้องการสร้างสรรค์คือ ความฉลาดหลักของ AI สามารถเข้าถึงได้ผ่าน API จากผู้เล่นรายใหญ่ เช่น OpenAI (ChatGPT/GPT-4), Anthropic (Claude) และ Google (PaLM/Gemini) ซึ่งหมายความว่าคุณไม่จำเป็นต้องฝึกโมเดลขนาดใหญ่ตั้งแต่เริ่มต้น

  • API ของ OpenAI มีการใช้งานอย่างแพร่หลาย เป็นที่รู้จักในด้านคุณภาพและความเป็นมิตรกับนักพัฒนา เหมาะสำหรับการใช้งานที่หลากหลาย
  • Claude ของ Anthropic มีหน้าต่างบริบท (context window) ที่ใหญ่มาก ยอดเยี่ยมสำหรับการประมวลผลเอกสารขนาดยาวในครั้งเดียว และถูกสร้างขึ้นโดยเน้นความปลอดภัยเป็นสำคัญ
  • Gemini ของ Google มีความสามารถด้านภาษาที่หลากหลายและแข็งแกร่ง และผสานรวมเข้ากับระบบนิเวศของ Google ได้อย่างแน่นแฟ้น โดย Gemini สัญญาว่าจะนำเสนอคุณสมบัติ multimodal ขั้นสูงและหน้าต่างบริบทที่ใหญ่เป็นพิเศษ
  • โมเดลโอเพนซอร์ส (เช่น Llama 3) และเฟรมเวิร์กการพัฒนา (เช่น LangChain หรือ LlamaIndex) ช่วยลดอุปสรรคในการเริ่มต้นได้อีก ให้ประโยชน์ด้านการประหยัดค่าใช้จ่าย ความเป็นส่วนตัว และเครื่องมือที่ช่วยให้งานง่ายขึ้น เช่น การเชื่อมต่อ LLM กับข้อมูลเฉพาะของคุณ

ด้วยทรัพยากรเหล่านี้ แม้แต่ทีมขนาดเล็กหรือนักพัฒนาแต่ละคนก็สามารถสร้างแอปพลิเคชันที่ซับซ้อนที่ใช้การสนทนาเป็นหลักได้ ซึ่งเป็นสิ่งที่ไม่อาจจินตนาการได้เมื่อไม่กี่ปีที่ผ่านมา กุญแจสำคัญคือแนวคิดที่ดี การออกแบบที่เน้นผู้ใช้เป็นศูนย์กลาง และการประยุกต์ใช้ API อันทรงพลังเหล่านี้อย่างชาญฉลาด

บทสนทนายังคงดำเนินต่อไป

เครื่องมือแชทที่ขับเคลื่อนด้วย LLM เป็นมากกว่าแค่เทรนด์ที่ผ่านมาแล้วผ่านไป; พวกมันแสดงถึงการเปลี่ยนแปลงพื้นฐานในวิธีที่เราโต้ตอบกับเทคโนโลยีและข้อมูล ในขณะที่แอปพลิเคชันปัจจุบันสร้างผลกระทบที่สำคัญอยู่แล้ว ช่องว่างที่ระบุและโอกาส "ที่ง่ายต่อการคว้า" บ่งชี้ว่าคลื่นแห่งนวัตกรรมยังห่างไกลจากการถึงจุดสูงสุด

เมื่อเทคโนโลยี LLM พัฒนาต่อไป—มีความแม่นยำมากขึ้น รับรู้บริบทได้ดีขึ้น ปรับแต่งเฉพาะบุคคลได้ และรองรับหลายรูปแบบ—เราสามารถคาดหวังการระเบิดของผู้ช่วยที่ใช้การแชทซึ่งมีความเชี่ยวชาญและมีผลกระทบมากยิ่งขึ้น อนาคตของการสนทนากำลังถูกเขียนขึ้นในตอนนี้ และเป็นอนาคตที่ AI มีบทบาทที่ช่วยเหลือและรวมเข้ากับชีวิตของเรามากขึ้นเรื่อยๆ