DeepSeek大模型“物美价廉”美国APP Store问鼎
中国AI新创DeepSeek双拳出击,大模型“物美价廉”冲上美国APP Store榜单
北京27日讯 – 近日,中国人工智能新创公司DeepSeek发布了两款全新大模型,并凭借其“物美价廉”的优势迅速引起关注。其中一款推理大模型DeepSeek-R1不仅在性能上接近OpenAI的GPT-4,更以极低的训练成本和开放许可证吸引了广泛的开发者青睐,甚至冲上了美国APP Store免费应用下载排行榜的第一名。
DeepSeek-R1是一款完全开源的推理大模型,采用MIT许可协议,允许免费商用、任意修改和衍生开发。在数学、代码、自然语言推理等任务上,其表现能够与OpenAI,o1正式版相媲美。更令人瞩目的是,DeepSeek-R1的训练成本仅为557.6万美元,约为GPT-4模型训练成本的十分之一,并在2048块英伟达H800 GPU集群上完成训练。
深潜团队在后训练阶段广泛应用强化学习技术,即使在极少标注数据的情况下,也显著提升了模型推理能力。此外,DeepSeek不仅公开R1训练技术,还蒸馏出6个小型模型开源供社区使用,方便用户借此进行其他模型的训练。
DeepSeek-R1的API定价更是吸引众多开发者关注。每百万输入token收费仅0.55美元,输出token收费为2.19美元/百万,与OpenAI最新版o1模型相比分别便宜约96.4%。研究者Shubham,Saboo建议已经订阅ChatGPT的开发者“放弃沉没成本”,选择更经济实惠的DeepSeek-R1。
英伟达高级研究科学家Jim,Fan认为DeepSeek-R1可能是首个展现强化学习飞轮在开源项目中发挥作用并带来持续增长的项目,其中,“飞轮”用来形容AI系统中自我强化、正向循环的过程。不同于传统AI模型往往依赖监督微调(SFT),DeepSeek-R1完全由强化学习驱动,证明直接强化学习的可行性。
Jim,Fan指出,“我们正处于一个奇特的时间线上,一家非美国公司正在践行OpenAI最初的使命,即实现真正开放的前沿研究并让所有人受益。”中国360创办人周鸿祎更表示,DeepSeek这家公司最近的表现“简直逆天”,相信将来如果要对抗美国的AI技术霸权,中国大模型技术复仇者联盟战队里一定有DeepSeek的一份,“因为这家公司和它的创始人非常低调,他们技术能力和未来前景被市场严重低估了。”