吴恩达评价DeepSeek:这无疑仍是构建AI创新的黄金时代!
原创 花生 花叔 2025-01-31 10:05
互动数据
- 阅读:1023
- 点赞:14
- 转发:49
- 喜欢:4
- 留言:未知
花生:DeepSeek R1最近在美国引发的风波不断,吴恩达今天也坐不住了,来发表了一段评价,其中有一些观点非常值得一读,包括:中国生成式AI正在加速赶超,视频生成模型已经处于领先地位,开源模型正在使基础模型加速商品化等。尤其在最后,吴恩达给出了一个令我们使用AI模型的普通人来说振奋人心的结论方向:这无疑仍是构建AI创新的黄金时代!
下面是全文翻译
本周围绕DeepSeek的热议,让许多人看清了几个正在发生的重要趋势:(i) 中国在生成式AI领域正赶超美国,这将重塑AI供应链格局;(ii) 开源权重模型正在使基础模型层商品化,为应用开发者创造机遇;(iii) 算力扩张并非AI进步的唯一路径。尽管行业对计算能力投入巨资并大肆炒作,算法创新正在快速降低训练成本。
约一周前,中国公司深度求索发布了DeepSeek-R1模型,其基准测试表现可与OpenAI的o1相媲美。更引人注目的是,该模型采用宽松的MIT许可协议开源。上周达沃斯论坛期间,我收到许多非技术背景的商业领袖对此事的询问。周一,股市更出现”深度求索抛售潮”:英伟达等多家美国科技公司股价应声下跌(截至发稿时部分已有所回升)。
我认为DeepSeek促使人们意识到三个关键点:
中国生成式AI加速赶超
当2022年11月ChatGPT问世时,美国在该领域遥遥领先。但认知转变往往滞后,直到最近仍有中美两国的朋友认为中国处于落后位置。实际上,过去两年间这个差距已快速缩小。通义千问(我的团队已使用数月)、Kimi、InternVL等中国模型的涌现,特别是DeepSeek的突破,表明中国正在快速接近。在视频生成等领域,中国甚至已显现领跑态势。
DeepSeek-R1的技术报告详尽开源令人振奋,这与美国部分企业借”AI灭绝风险”等假设性威胁打压开源形成鲜明对比。开源模型现已成为AI供应链的关键环节:众多企业将依赖这些基础模型。若美国持续遏制开源,中国将主导该领域,最终全球企业使用的模型将更多体现中国而非美国的价值观。
开源权重模型正在使基础模型层商品化。
正如我之前所述,大语言模型的token价格正快速下降,开源模型不仅助推了这一趋势,更为开发者提供了多元选择。OpenAI的o1模型每百万输出token收费60美元,而DeepSeek R1仅需2.19美元——近30倍的价格差让成本下降趋势成为显性焦点。
当前,依赖训练基础模型并通过API接口收费的商业模式面临严峻挑战。该领域多数公司仍在探索如何收回动辄数亿美元的模型训练成本。红杉资本《AI的6000亿美元难题》(原文:AI’s $600B Question)对此有精辟论述(需说明的是,我始终认为基础模型公司的技术突破令人钦佩)。相较之下,基于开源模型构建应用层则涌现出巨大商机:当他人耗资数十亿训练出基础模型后,你仅需支付几美元即可调用这些模型,开发客服聊天机器人、邮件摘要工具、AI医生、法律文档助手等创新应用。
行业长期存在”规模决定论”的迷思。
诚然,我本人也曾是模型规模化扩张的早期支持者。部分公司通过渲染”资金投入越多→模型规模越大→性能必然提升”的叙事成功融资数十亿美元,导致行业过度聚焦算力军备竞赛,而忽视了算法创新等多元化进步路径。受美国AI芯片禁令倒逼,DeepSeek团队不得不在H800(性能弱于H100)显卡上进行多重优化创新,最终以低于600万美元的纯算力成本完成模型训练(研发成本未计入)。
短期来看,单位算力成本下降是否会降低整体需求仍存疑——经济学中的”吉芬商品”效应(价格下降反而刺激需求增长)可能在此上演。但从长期视角,人类对智能和算力的需求几乎永无止境。即便算力成本持续走低,我仍坚信人类文明对智能的消费总量将呈指数级增长。
在社交平台X上,人们对DeepSeek进展的解读宛如”罗夏墨迹测试”,投射出各异的价值判断。在我看来,DeepSeek-R1的地缘政治影响尚待显现,但其对AI应用开发者的价值已毋庸置疑。我的团队正基于这款开源高阶推理模型,探索此前难以实现的全新应用场景。这无疑仍是构建AI创新的黄金时代!
原文链接:https://www.deeplearning.ai/the-batch/issue-286/
如果你也想通过AI编程获得代码杠杆,享受使用AI创造创新的快乐,欢迎加入到我的「AI编程」知识星球。