ข้ามไปยังเนื้อหาหลัก

การปฏิวัติแบบโอเพนซอร์สของ DeepSeek: ข้อมูลเชิงลึกจากการประชุมสุดยอด AI แบบปิดประตู

· อ่านหนึ่งนาที
Lark Birdy
Chief Bird Officer

การปฏิวัติแบบโอเพนซอร์สของ DeepSeek: ข้อมูลเชิงลึกจากการประชุมสุดยอด AI แบบปิดประตู

DeepSeek กำลังสร้างความฮือฮาในโลก AI เพียงแค่การสนทนาเกี่ยวกับ DeepSeek-R1 ยังไม่ทันจางหาย ทีมงานก็ได้ปล่อยข่าวใหญ่: โมเดลมัลติโหมดแบบโอเพนซอร์ส Janus-Pro ความเร็วที่เกิดขึ้นทำให้เวียนหัว ความทะเยอทะยานชัดเจน

การปฏิวัติแบบโอเพนซอร์สของ DeepSeek: ข้อมูลเชิงลึกจากการประชุมสุดยอด AI แบบปิดประตู

เมื่อสองวันที่ผ่านมา กลุ่มนักวิจัย AI ชั้นนำ นักพัฒนา และนักลงทุนได้มารวมตัวกันเพื่อการสนทนาแบบปิดประตูที่จัดโดย Shixiang โดยเน้นไปที่ DeepSeek โดยเฉพาะ ในช่วงเวลากว่าสามชั่วโมง พวกเขาได้แยกแยะนวัตกรรมทางเทคนิคของ DeepSeek โครงสร้างองค์กร และผลกระทบที่กว้างขึ้นของการเติบโตของมัน—ต่อโมเดลธุรกิจ AI ตลาดรอง และทิศทางระยะยาวของการวิจัย AI

ตามแนวคิดของ DeepSeek ที่เน้นความโปร่งใสแบบโอเพนซอร์ส เรากำลังเปิดเผยความคิดร่วมของเราให้สาธารณชน นี่คือข้อมูลเชิงลึกที่กลั่นกรองจากการสนทนา ครอบคลุมกลยุทธ์ของ DeepSeek นวัตกรรมทางเทคนิค และผลกระทบที่อาจมีต่ออุตสาหกรรม AI

DeepSeek: ความลึกลับและภารกิจ

  • ภารกิจหลักของ DeepSeek: CEO Liang Wenfeng ไม่ใช่แค่ผู้ประกอบการ AI อีกคน—เขาเป็นวิศวกรโดยหัวใจ แตกต่างจาก Sam Altman เขามุ่งเน้นไปที่การดำเนินการทางเทคนิค ไม่ใช่แค่วิสัยทัศน์
  • ทำไม DeepSeek ได้รับความเคารพ: สถาปัตยกรรม MoE (Mixture of Experts) ของมันเป็นตัวแยกแยะที่สำคัญ การทำซ้ำโมเดล o1 ของ OpenAI ในระยะแรกเป็นเพียงการเริ่มต้น—ความท้าทายที่แท้จริงคือการขยายด้วยทรัพยากรที่จำกัด
  • การขยายโดยไม่ต้องพึ่งพา NVIDIA: แม้จะมีการอ้างว่ามี GPU 50,000 ตัว แต่ DeepSeek น่าจะดำเนินการด้วย A100s เก่าประมาณ 10,000 ตัวและ H800s ก่อนการแบน 3,000 ตัว แตกต่างจากห้องปฏิบัติการในสหรัฐฯ ที่ใช้คอมพิวเตอร์แก้ปัญหาทุกอย่าง DeepSeek ถูกบังคับให้มีประสิทธิภาพ
  • จุดเน้นที่แท้จริงของ DeepSeek: แตกต่างจาก OpenAI หรือ Anthropic, DeepSeek ไม่ได้ยึดติดกับ “AI ที่ให้บริการมนุษย์” แต่กำลังไล่ตามปัญญาเอง นี่อาจเป็นอาวุธลับของมัน

นักสำรวจ vs. ผู้ตาม: กฎพลังของ AI

  • การพัฒนา AI เป็นฟังก์ชันขั้น: ต้นทุนของการตามทันต่ำกว่า 10 เท่าของการเป็นผู้นำ “ผู้ตาม” ใช้ประโยชน์จากความก้าวหน้าที่ผ่านมาในต้นทุนคอมพิวเตอร์ที่น้อยกว่า ในขณะที่ “นักสำรวจ” ต้องก้าวไปข้างหน้าอย่างมืดบอด แบกรับค่าใช้จ่าย R&D มหาศาล
  • DeepSeek จะเหนือกว่า OpenAI หรือไม่? เป็นไปได้—แต่เฉพาะเมื่อ OpenAI สะดุด AI ยังคงเป็นปัญหาที่เปิดกว้าง และวิธีการของ DeepSeek ต่อโมเดลการให้เหตุผลเป็นการเดิมพันที่แข็งแกร่ง

นวัตกรรมทางเทคนิคเบื้องหลัง DeepSeek

1. จุดจบของการปรับแต่งแบบกำกับ (SFT)?

  • การอ้างสิทธิ์ที่ก่อกวนที่สุดของ DeepSeek: SFT อาจไม่จำเป็นอีกต่อไปสำหรับงานการให้เหตุผล หากเป็นจริง นี่ถือเป็นการเปลี่ยนแปลงแนวคิด
  • แต่ช้าก่อน… DeepSeek-R1 ยังคงพึ่งพา SFT โดยเฉพาะสำหรับการจัดตำแหน่ง การเปลี่ยนแปลงที่แท้จริงคือวิธีการใช้ SFT—การกลั่นกรองงานการให้เหตุผลอย่างมีประสิทธิภาพมากขึ้น

2. ประสิทธิภาพของข้อมูล: คูเมืองที่แท้จริง

  • ทำไม DeepSeek ให้ความสำคัญกับการติดป้ายข้อมูล: Liang Wenfeng รายงานว่าติดป้ายข้อมูลด้วยตนเอง เน้นย้ำถึงความสำคัญ ความสำเร็จของ Tesla ในการขับขี่ด้วยตนเองมาจากการใส่ใจในรายละเอียดของมนุษย์—DeepSeek กำลังใช้ความเข้มงวดเดียวกัน
  • ข้อมูลหลายโหมด: ยังไม่พร้อม—แม้จะมีการเปิดตัว Janus-Pro แต่การเรียนรู้หลายโหมดยังคงมีค่าใช้จ่ายสูง ไม่มีห้องปฏิบัติการใดที่แสดงให้เห็นถึงผลกำไรที่น่าดึงดูด

3. การกลั่นโมเดล: ดาบสองคม

  • การกลั่นช่วยเพิ่มประสิทธิภาพแต่ลดความหลากหลาย: สิ่งนี้อาจจำกัดความสามารถของโมเดลในระยะยาว
  • “หนี้ที่ซ่อนอยู่” ของการกลั่น: โดยไม่เข้าใจถึงความท้าทายพื้นฐานของการฝึกอบรม AI การพึ่งพาการกลั่นอาจนำไปสู่ปัญหาที่ไม่คาดคิดเมื่อสถาปัตยกรรมรุ่นใหม่เกิดขึ้น

4. รางวัลกระบวนการ: พรมแดนใหม่ในการจัดตำแหน่ง AI

  • การควบคุมผลลัพธ์กำหนดเพดาน: การเรียนรู้เสริมแรงตามกระบวนการอาจป้องกันการแฮ็ก แต่ขีดจำกัดบนของปัญญายังคงขึ้นอยู่กับการตอบกลับที่ขับเคลื่อนด้วยผลลัพธ์
  • ปริศนา RL: โมเดลภาษาขนาดใหญ่ (LLMs) ไม่มีเงื่อนไขการชนะที่ชัดเจนเหมือนหมากรุก AlphaZero ทำงานได้เพราะชัยชนะเป็นแบบไบนารี การให้เหตุผลของ AI ขาดความชัดเจนนี้

ทำไม OpenAI ถึงไม่ใช้วิธีของ DeepSeek?

  • เรื่องของการมุ่งเน้น: OpenAI ให้ความสำคัญกับขนาด ไม่ใช่ประสิทธิภาพ
  • “สงคราม AI ที่ซ่อนอยู่” ในสหรัฐอเมริกา: OpenAI และ Anthropic อาจเพิกเฉยต่อวิธีการของ DeepSeek แต่พวกเขาจะไม่ทำเช่นนั้นอีกต่อไป หาก DeepSeek พิสูจน์ได้ว่าใช้งานได้ คาดว่าจะมีการเปลี่ยนแปลงทิศทางการวิจัย

อนาคตของ AI ในปี 2025

  • เกินกว่า Transformers? AI มีแนวโน้มที่จะแยกออกเป็นสถาปัตยกรรมที่แตกต่างกัน สาขานี้ยังคงยึดติดกับ Transformers แต่โมเดลทางเลือกอาจเกิดขึ้น
  • ศักยภาพที่ยังไม่ได้ใช้ของ RL: การเรียนรู้เสริมแรงยังคงไม่ได้ใช้ประโยชน์นอกโดเมนแคบ ๆ เช่น คณิตศาสตร์และการเขียนโค้ด
  • ปีของตัวแทน AI? แม้จะมีการโฆษณา แต่ยังไม่มีห้องปฏิบัติการใดที่ส่งมอบตัวแทน AI ที่ก้าวหน้า

นักพัฒนาจะย้ายไปที่ DeepSeek หรือไม่?

  • ยังไม่ใช่. ความสามารถในการเขียนโค้ดและการปฏิบัติตามคำแนะนำที่เหนือกว่าของ OpenAI ยังคงให้ความได้เปรียบ
  • แต่ช่องว่างกำลังปิดลง. หาก DeepSeek รักษาโมเมนตัมไว้ได้ นักพัฒนาอาจเปลี่ยนในปี 2025

การเดิมพัน OpenAI Stargate มูลค่า 500 พันล้านดอลลาร์: ยังมีเหตุผลหรือไม่?

  • การเพิ่มขึ้นของ DeepSeek ทำให้เกิดข้อสงสัยเกี่ยวกับการครอบงำของ NVIDIA. หากประสิทธิภาพมีความสำคัญมากกว่าการขยายขนาดแบบใช้กำลังดิบ ซูเปอร์คอมพิวเตอร์มูลค่า 500 พันล้านดอลลาร์ของ OpenAI อาจดูเกินความจำเป็น
  • OpenAI จะใช้จ่าย 500 พันล้านดอลลาร์จริงหรือไม่? SoftBank เป็นผู้สนับสนุนทางการเงิน แต่ขาดสภาพคล่อง การดำเนินการยังคงไม่แน่นอน
  • Meta กำลังย้อนกลับวิศวกรรม DeepSeek. สิ่งนี้ยืนยันถึงความสำคัญของมัน แต่ไม่แน่ใจว่า Meta สามารถปรับแผนงานของตนได้หรือไม่

ผลกระทบต่อตลาด: ผู้ชนะและผู้แพ้

  • ระยะสั้น: หุ้นชิป AI รวมถึง NVIDIA อาจเผชิญกับความผันผวน
  • ระยะยาว: เรื่องราวการเติบโตของ AI ยังคงไม่เปลี่ยนแปลง—DeepSeek เพียงพิสูจน์ว่าประสิทธิภาพมีความสำคัญพอ ๆ กับพลังดิบ

โอเพนซอร์ส vs. โคลสซอร์ส: แนวรบใหม่

  • หากโมเดลโอเพนซอร์สเข้าถึง 95% ของประสิทธิภาพโคลสซอร์ส, โมเดลธุรกิจ AI ทั้งหมดจะเปลี่ยนไป
  • DeepSeek กำลังบังคับให้ OpenAI ต้องลงมือ. หากโมเดลโอเพนยังคงพัฒนาอย่างต่อเนื่อง AI ที่เป็นกรรมสิทธิ์อาจไม่ยั่งยืน

ผลกระทบของ DeepSeek ต่อกลยุทธ์ AI ระดับโลก

  • จีนกำลังตามทันเร็วกว่าที่คาด. ช่องว่าง AI ระหว่างจีนและสหรัฐฯ อาจมีเพียง 3-9 เดือน ไม่ใช่สองปีตามที่เคยคิด
  • DeepSeek เป็นหลักฐานแนวคิดสำหรับกลยุทธ์ AI ของจีน. แม้จะมีข้อจำกัดด้านคอมพิวเตอร์ แต่การสร้างนวัตกรรมที่ขับเคลื่อนด้วยประสิทธิภาพก็ได้ผล

คำสุดท้าย: วิสัยทัศน์มีความสำคัญมากกว่าเทคโนโลยี

  • ตัวแยกแยะที่แท้จริงของ DeepSeek คือความทะเยอทะยาน. ความก้าวหน้าใน AI มาจากการผลักดันขอบเขตของปัญญา ไม่ใช่แค่การปรับปรุงโมเดลที่มีอยู่
  • การต่อสู้ครั้งต่อไปคือการให้เหตุผล. ใครก็ตามที่บุกเบิกโมเดลการให้เหตุผล AI รุ่นต่อไปจะกำหนดทิศทางของอุตสาหกรรม

การทดลองทางความคิด: หากคุณมีโอกาสถามคำถาม CEO ของ DeepSeek Liang Wenfeng หนึ่งคำถาม คุณจะถามอะไร? คำแนะนำที่ดีที่สุดของคุณสำหรับบริษัทในขณะที่มันขยายตัวคืออะไร? แบ่งปันความคิดของคุณ—คำตอบที่โดดเด่นอาจได้รับเชิญให้เข้าร่วมการประชุมสุดยอด AI แบบปิดประตูครั้งต่อไป

DeepSeek ได้เปิดบทใหม่ใน AI ไม่ว่าจะเขียนเรื่องราวทั้งหมดใหม่หรือไม่ยังคงต้องติดตามต่อไป