Lewati ke konten utama

Revolusi Open-Source DeepSeek: Wawasan dari KTT AI Tertutup

· Satu menit baca
Lark Birdy
Chief Bird Officer

Revolusi Open-Source DeepSeek: Wawasan dari KTT AI Tertutup

DeepSeek sedang mengguncang dunia AI. Tepat ketika diskusi tentang DeepSeek-R1 belum mereda, tim ini meluncurkan kejutan lain: model multimodal open-source, Janus-Pro. Laju perkembangan ini memusingkan, ambisinya jelas.

Revolusi Open-Source DeepSeek: Wawasan dari KTT AI Tertutup

Dua hari lalu, sekelompok peneliti AI terkemuka, pengembang, dan investor berkumpul untuk diskusi tertutup yang diselenggarakan oleh Shixiang, yang berfokus secara eksklusif pada DeepSeek. Selama lebih dari tiga jam, mereka membedah inovasi teknis DeepSeek, struktur organisasi, dan implikasi lebih luas dari kebangkitannya—pada model bisnis AI, pasar sekunder, dan lintasan jangka panjang penelitian AI.

Mengikuti etos transparansi open-source DeepSeek, kami membuka pemikiran kolektif kami kepada publik. Berikut adalah wawasan yang disaring dari diskusi tersebut, mencakup strategi DeepSeek, terobosan teknisnya, dan dampaknya pada industri AI.

DeepSeek: Misteri & Misi

  • Misi Inti DeepSeek: CEO Liang Wenfeng bukan hanya pengusaha AI biasa—dia adalah seorang insinyur sejati. Berbeda dengan Sam Altman, dia fokus pada eksekusi teknis, bukan hanya visi.
  • Mengapa DeepSeek Dihormati: Arsitektur MoE (Mixture of Experts) adalah pembeda utama. Replikasi awal model o1 OpenAI hanyalah permulaan—tantangan sebenarnya adalah skala dengan sumber daya terbatas.
  • Meningkatkan Skala Tanpa Restu NVIDIA: Meskipun klaim memiliki 50.000 GPU, DeepSeek kemungkinan beroperasi dengan sekitar 10.000 A100 yang sudah tua dan 3.000 H800 sebelum larangan. Berbeda dengan laboratorium AS yang mengandalkan komputasi untuk setiap masalah, DeepSeek dipaksa menjadi efisien.
  • Fokus Sebenarnya DeepSeek: Berbeda dengan OpenAI atau Anthropic, DeepSeek tidak terobsesi dengan “AI melayani manusia.” Sebaliknya, ia mengejar kecerdasan itu sendiri. Ini mungkin senjata rahasianya.

Penjelajah vs. Pengikut: Hukum Kekuasaan AI

  • Pengembangan AI adalah Fungsi Langkah: Biaya untuk mengejar ketinggalan 10x lebih rendah daripada memimpin. “Pengikut” memanfaatkan terobosan masa lalu dengan biaya komputasi yang lebih rendah, sementara “penjelajah” harus maju secara membabi buta, menanggung biaya R&D yang besar.
  • Apakah DeepSeek Akan Melampaui OpenAI? Itu mungkin—tetapi hanya jika OpenAI tersandung. AI masih merupakan masalah terbuka, dan pendekatan DeepSeek terhadap model penalaran adalah taruhan yang kuat.

Inovasi Teknis di Balik DeepSeek

1. Akhir dari Fine-Tuning Terawasi (SFT)?

  • Klaim paling mengganggu dari DeepSeek: SFT mungkin tidak lagi diperlukan untuk tugas penalaran. Jika benar, ini menandai pergeseran paradigma.
  • Tapi Tidak Begitu Cepat… DeepSeek-R1 masih bergantung pada SFT, terutama untuk penyelarasan. Pergeseran sebenarnya adalah bagaimana SFT digunakan—menyaring tugas penalaran lebih efektif.

2. Efisiensi Data: Parit Sebenarnya

  • Mengapa DeepSeek Memprioritaskan Pelabelan Data: Liang Wenfeng dilaporkan melabeli data sendiri, menekankan pentingnya. Keberhasilan Tesla dalam mengemudi sendiri datang dari anotasi manusia yang teliti—DeepSeek menerapkan ketelitian yang sama.
  • Data Multi-Modal: Belum Siap—Meskipun Janus-Pro dirilis, pembelajaran multi-modal tetap sangat mahal. Belum ada laboratorium yang menunjukkan keuntungan yang meyakinkan.

3. Distilasi Model: Pedang Bermata Dua

  • Distilasi Meningkatkan Efisiensi tetapi Menurunkan Keberagaman: Ini bisa membatasi kemampuan model dalam jangka panjang.
  • “Utang Tersembunyi” dari Distilasi: Tanpa memahami tantangan mendasar dari pelatihan AI, mengandalkan distilasi dapat menyebabkan masalah yang tidak terduga ketika arsitektur generasi berikutnya muncul.

4. Penghargaan Proses: Perbatasan Baru dalam Penyelarasan AI

  • Pengawasan Hasil Menentukan Batas Atas: Pembelajaran penguatan berbasis proses dapat mencegah peretasan, tetapi batas atas kecerdasan masih bergantung pada umpan balik berbasis hasil.
  • Paradoks RL: Model Bahasa Besar (LLM) tidak memiliki kondisi kemenangan yang terdefinisi seperti catur. AlphaZero berhasil karena kemenangan bersifat biner. Penalaran AI tidak memiliki kejelasan ini.

Mengapa OpenAI Belum Menggunakan Metode DeepSeek?

  • Masalah Fokus: OpenAI memprioritaskan skala, bukan efisiensi.
  • “Perang AI Tersembunyi” di AS: OpenAI dan Anthropic mungkin telah mengabaikan pendekatan DeepSeek, tetapi mereka tidak akan lama. Jika DeepSeek terbukti layak, harapkan perubahan arah penelitian.

Masa Depan AI di 2025

  • Melampaui Transformer? AI kemungkinan akan bercabang menjadi arsitektur yang berbeda. Bidang ini masih terobsesi dengan Transformer, tetapi model alternatif bisa muncul.
  • Potensi RL yang Belum Digunakan: Pembelajaran penguatan masih kurang dimanfaatkan di luar domain sempit seperti matematika dan pemrograman.
  • Tahun Agen AI? Meskipun ada hype, belum ada laboratorium yang memberikan terobosan agen AI.

Apakah Pengembang Akan Beralih ke DeepSeek?

  • Belum. Kemampuan pengkodean dan mengikuti instruksi OpenAI yang unggul masih memberikannya keunggulan.
  • Tapi Kesenjangan Sedang Menyempit. Jika DeepSeek mempertahankan momentum, pengembang mungkin beralih pada 2025.

Taruhan OpenAI Stargate $500B: Apakah Masih Masuk Akal?

  • Kebangkitan DeepSeek Meragukan Dominasi NVIDIA. Jika efisiensi mengalahkan skala brute-force, superkomputer $500B OpenAI mungkin tampak berlebihan.
  • Apakah OpenAI Benar-benar Akan Menghabiskan $500B? SoftBank adalah pendukung keuangan, tetapi tidak memiliki likuiditas. Eksekusi tetap tidak pasti.
  • Meta Sedang Membalikkan Rekayasa DeepSeek. Ini menegaskan signifikansinya, tetapi apakah Meta dapat menyesuaikan peta jalannya tetap tidak jelas.

Dampak Pasar: Pemenang & Pecundang

  • Jangka Pendek: Saham chip AI, termasuk NVIDIA, mungkin menghadapi volatilitas.
  • Jangka Panjang: Cerita pertumbuhan AI tetap utuh—DeepSeek hanya membuktikan bahwa efisiensi sama pentingnya dengan kekuatan mentah.

Open Source vs. Closed Source: Medan Pertempuran Baru

  • Jika Model Open-Source Mencapai 95% dari Kinerja Closed-Source, seluruh model bisnis AI berubah.
  • DeepSeek Memaksa Tangan OpenAI. Jika model terbuka terus meningkat, AI proprietary mungkin tidak berkelanjutan.

Dampak DeepSeek pada Strategi AI Global

  • China Mengejar Lebih Cepat dari yang Diharapkan. Kesenjangan AI antara China dan AS mungkin hanya 3-9 bulan, bukan dua tahun seperti yang diperkirakan sebelumnya.
  • DeepSeek adalah Bukti Konsep untuk Strategi AI China. Meskipun ada keterbatasan komputasi, inovasi yang didorong oleh efisiensi berhasil.

Kata Terakhir: Visi Lebih Penting daripada Teknologi

  • Pembeda Sebenarnya DeepSeek adalah Ambisinya. Terobosan AI datang dari mendorong batas kecerdasan, bukan hanya menyempurnakan model yang ada.
  • Pertempuran Berikutnya adalah Penalaran. Siapa pun yang mempelopori generasi berikutnya dari model penalaran AI akan menentukan lintasan industri.

Eksperimen Pemikiran: Jika Anda memiliki satu kesempatan untuk bertanya kepada CEO DeepSeek Liang Wenfeng, apa yang akan Anda tanyakan? Apa saran terbaik Anda untuk perusahaan saat berkembang? Sampaikan pemikiran Anda—respon yang menonjol mungkin saja mendapatkan undangan ke KTT AI tertutup berikutnya.

DeepSeek telah membuka babak baru dalam AI. Apakah itu menulis ulang seluruh cerita masih harus dilihat.