DeepSeek 的开源革命:闭门 AI 峰会的见解
· 一分钟阅读
DeepSeek 的开源革命:闭门 AI 峰会的见解
DeepSeek 正在迅速席卷 AI 世界。就在关于 DeepSeek-R1 的讨论尚未平息时,团队又投下了一颗重磅炸弹:一个开源的多模态模型 Janus-Pro。步伐令人眼花缭乱,雄心昭然若揭。
两天前,一群顶尖的 AI 研究人员、开发者和投资者聚集在由 Shixiang 主办的闭门讨论会上,专注于 DeepSeek。在三个多小时的时间里,他们剖析了 DeepSeek 的技术创新、组织结构及其崛起的广泛影响——对 AI 商业模式、二级市场以及 AI 研究的长期轨迹。
遵循 DeepSeek 的开源透明原则,我们将集体思考向公众开放。以下是讨论中提炼出的见解,涵盖了 DeepSeek 的战略、技术突破及其对 AI 行业可能产生的影响。
DeepSeek:谜团与使命
- DeepSeek 的核心使命: CEO 梁文峰不仅仅是另一个 AI 企业家——他本质上是一个工程师。与 Sam Altman 不同,他专注于技术执行,而不仅仅是愿景。
- DeepSeek 赢得尊重的原因: 其 MoE(专家混合)架构是一个关键的差异化因素。早期复制 OpenAI 的 o1 模型只是开始——真正的挑战是如何在有限资源下进行扩展。
- 在没有 NVIDIA 支持下的扩展: 尽管声称拥有 50,000 个 GPU,DeepSeek 可能只使用了大约 10,000 个老化的 A100 和 3,000 个禁令前的 H800。与美国实验室不同,DeepSeek 被迫追求效率。
- DeepSeek 的真正关注点: 与 OpenAI 或 Anthropic 不同,DeepSeek 并不执着于“AI 服务人类”。相反,它追求的是智能本身。这可能是它的秘密武器。
探索者与追随者:AI 的幂律法则
- AI 发展是一个阶跃函数: 追赶的成本比领先低 10 倍。“追随者”以计算成本的一小部分利用过去的突破,而“探索者”必须盲目推进,承担巨大的研发费用。
- DeepSeek 会超越 OpenAI 吗? 这是可能的——但前提是 OpenAI 出现失误。AI 仍然是一个开放性问题,DeepSeek 对推理模型的方法是一个强有力的赌注。