短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型:DeepSeek-V3和DeepSeek-R1。这两款模型成本低廉,性能与OpenAI相当,让硅谷震惊,并引发了meta内部的恐慌,工程师们开始连夜尝试复制DeepSeek的成果。

Scale AI创始人Alexander Wang在采访中表示,DeepSeek在他们的测试里表现最好,与美国最好的模型相当。他还提到,DeepSeek-V3是中国科技界带给美国的一个教训,中国以更低的成本、更快的速度和更强的实力追赶上来。

中国AI的新进展引起了国外媒体的广泛关注,被视为对硅谷的一次警钟。尤其是在5000亿美元的“星际之门”计划公布之际,DeepSeek以极低的价格建立了一个突破性的AI模型,而且没有使用尖端芯片,这引发了人们对于巨额资本投入是否有效的质疑。

一名匿名meta员工透露,公司内部因DeepSeek的模型进入了恐慌模式。DeepSeek-V3在基准测试中已经超越了Llama 4,而其训练预算仅为550万美元。工程师们正在争分夺秒地分析DeepSeek,试图复制其中的技术。管理层则为GenAI研发部门的巨额投入感到焦虑,高管薪资甚至超过了训练整个DeepSeek V3的成本。

![[快讯]法国总统马克龙用中文发帖拜年 多语言送祝福](http://cn.gzbj58.com/file/upload/202602/18/000456781.jpg)
![[快讯]印尼一架飞机遭枪击坠毁 两名飞行员遇难](http://cn.gzbj58.com/file/upload/202602/12/004327751.jpg)
![[快讯]泰国大选爆冷背后释放啥信号 政治格局大洗牌](http://cn.gzbj58.com/file/upload/202602/11/003203861.jpg)
