DeepSeek:国产大模型真实力?

深度思考还是深度炒作?国产大模型DeepSeek引发争议

近日,一款名为DeepSeek的国产大模型在国内媒体中“一夜爆红”,被赞誉为“拳打ChatGPT,脚踏英伟达”,“来自东方的神秘力量”。然而,随着越来越多的用户体验这款产品,对其真实实力和宣传的差距也逐渐浮出水面。

许多用户认为DeepSeek的确是目前最好的中文大模型平台,在理解能力和答案输出能力上都远超此前百度的文心一言和抖音豆包,但将其与ChatGPT进行对比则显得有些夸张。更令人担忧的是,DeepSeek所依赖的软硬件基础仍然基于美国产品之上,其核心Transformer模型源自谷歌,算力更是依靠英伟达显卡支撑。

尽管深挖内部人士透露DeepSeek团队斥巨资囤积了大量英伟达高端显卡,但这也表明其技术发展依然离不开外来依赖。同时,DeepSeek在速度方面也远逊于ChatGPT,用户体验显示,一个简单的问答需要等待数十秒甚至几分钟的时间,难以满足人们对快速交互的期待。

尽管如此,DeepSeek确实拥有海量中文数据抓取基础,能够学习模拟不同的中文语气和风格,生成更接近人类表达的文章。在写作能力方面,DeepSeek已能替代部分公文写作甚至社论写作,这对评论员来说无疑是一项挑战。

然而,DeepSeek绕不开的审核问题也引发了争议。一些用户发现,DeepSeek在尺度上远超BAT和字节大模型,能够生成关于政治、历史等敏感信息的内容,甚至可以对名人进行讽刺性的评价。例如,DeepSeek生成的针对胡锡进的文章犀利而尖刻,令人意外。

总而言之,DeepSeek的出现既是国产人工智能技术进步的体现,也是宣传炒作与实际能力差距的缩影。其未来的发展前景仍需要拭目以待。

文章为网友上传,如果侵权,请联系我们

发表评论