DeepSeek 逆袭:2048块芯片AI震撼全球
中国AI公司 DeepSeek 逆袭!仅用2048块芯片训练出的语言模型震惊全球
中国人工智能公司 DeepSeek 近期发布的语言模型 R1 和 V3,凭借其出色的性能和低成本训练方式,迅速在科技界引发热议。许多专家甚至将它誉为“AI史上的Sputnik时刻”。
DeepSeek 成立于2023年7月,总部位于中国杭州。该公司去年底发布的 DeepSeek-V3 语言模型仅使用 2048 块辉达 H800 型GPU(针对中国市场的阉割版GPU)训练55天,耗资仅 557.6 万美元,却能与 GPT-4、Claude 等西方顶尖语言模型媲美,甚至在数学、程式码和自然语言推理等方面超越了 OpenAI 的官方版本。
DeepSeek 的崛起震惊了全球科技界。硅谷风险投资家马克·安德森在社交媒体上赞叹称:“这是最令人印象深刻的突破之一。”《纽约时报》分析认为,DeepSeek 不仅表现出中国 AI 技术快速发展的势头,更颠覆了人们对 AI 开发成本和技术瓶颈的认知。
与西方科技巨头不同,DeepSeek 依靠极低的成本实现了强大的性能表现,这主要得益于其高效的训练方法和开源模型策略。OpenAI 前高管卡斯表示,资源限制往往会激发创造力,DeepSeek 的成功正是证明。
此外,DeepSeek 采取的免费开放模型策略也为开发者提供了一条更便捷的 AI 应用之路,进一步加速了中国 AI 的发展步伐。
DeepSeek 的出现引发了全球对中国 AI 行业实力的新认识,同时也促使西方国家重新思考其在 AI 领域的发展战略。
文章为网友上传,如果侵权,请联系我们