DeepSeek 逆袭：2048块芯片AI震撼全球

加我进多伦多微信群：k691626 2025年1月28日

中国AI公司 DeepSeek 逆袭！仅用2048块芯片训练出的语言模型震惊全球

中国人工智能公司 DeepSeek 近期发布的语言模型 R1 和 V3，凭借其出色的性能和低成本训练方式，迅速在科技界引发热议。许多专家甚至将它誉为“AI史上的Sputnik时刻”。

DeepSeek 成立于2023年7月，总部位于中国杭州。该公司去年底发布的 DeepSeek-V3 语言模型仅使用 2048 块辉达 H800 型GPU（针对中国市场的阉割版GPU）训练55天，耗资仅 557.6 万美元，却能与 GPT-4、Claude 等西方顶尖语言模型媲美，甚至在数学、程式码和自然语言推理等方面超越了 OpenAI 的官方版本。

DeepSeek 的崛起震惊了全球科技界。硅谷风险投资家马克·安德森在社交媒体上赞叹称：“这是最令人印象深刻的突破之一。”《纽约时报》分析认为，DeepSeek 不仅表现出中国 AI 技术快速发展的势头，更颠覆了人们对 AI 开发成本和技术瓶颈的认知。

与西方科技巨头不同，DeepSeek 依靠极低的成本实现了强大的性能表现，这主要得益于其高效的训练方法和开源模型策略。OpenAI 前高管卡斯表示，资源限制往往会激发创造力，DeepSeek 的成功正是证明。

此外，DeepSeek 采取的免费开放模型策略也为开发者提供了一条更便捷的 AI 应用之路，进一步加速了中国 AI 的发展步伐。

DeepSeek 的出现引发了全球对中国 AI 行业实力的新认识，同时也促使西方国家重新思考其在 AI 领域的发展战略。

文章为网友上传，如果侵权，请联系我们

DeepSeek 逆袭：2048块芯片AI震撼全球

中国AI公司 DeepSeek 逆袭！仅用2048块芯片训练出的语言模型震惊全球

发表评论