DeepSeek低成本AI震撼硅谷

中国AI新星DeepSeek掀起硅谷风暴,以超低成本挑战巨头

中国新创企业DeepSeek(深度求索)近两个月推出了DeepSeek-V3和DeepSick-R1两款全新AI模型,其自研APP在苹果App Store下载排行榜上迅速冲至第一位,远远超过了ChatGPT的排名。这款低成本、高性能的AI模型表现与全球顶尖AI语言模型OpenAI的ChatGPT-4不相上下,令整个硅谷为之震动,更让美国科技巨头Meta的生成式AI部门陷入危机。

匿名职场论坛TeamBlind上的一位自称是Meta员工的用户发文称,DeepSeek横空出世后,其技术水平直接超越了Meta旗下的Llama 4模型,让整个公司上下都陷入了恐慌。更令Meta难以接受的是,这家中国企业仅用550万美元就训练完成了DeepSeek,成本只有Meta的十一分之一。这位员工坦言,DeepSeek以超低成本完成大规模模型训练,颠覆了行业对高昂成本的传统认知。“单只Meta生成式AI部门里的主管薪资就已超过了DeepSeek训练AI的成本,而且我们这里有几十位领著高薪的主管,我根本无法想像他们该如何向公司证明部门目前高额成本的合理性。”

外媒The Information指出,OpenAI、Meta和其他顶尖AI公司的工程师正疯狂地研究DeepSeek模型,试图解读其技术秘密,复制其成功模式,但暂时还不得其解。 Meta更为此筹组了4个“战情室”,2个聚焦研究如何降低训练和运作DeepSeek的成本,另2个则负责厘清DeepSeek使用了哪些数据来训练其模型,及基于DeepSeek模型归纳出的特质,重新建构Meta的模型。

这场由中国新创企业掀起的AI风暴,无疑将深刻地影响全球科技格局,也让人们对未来人工智能发展充满了期待和思考。

文章为网友上传,如果侵权,请联系我们

发表评论