果然财经|飞龙在天、大杀四方的DeepSeek，到底有啥魔力

科技新闻 2025-01-2982网络

齐鲁晚报·齐鲁壹点记者张頔

在农历龙年的最后几天，横空出世的DeepSeek如飞龙在天，给了全球科技界“亿点点”震撼。

DeepSeek是量化巨头幻方量化旗下大模型公司，1月20日，该公司正式发布推理大模型DeepSeek-R1。1月27日，DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜，在美区下载榜上超越了ChatGPT。

因为底层技术路线上颠覆了以GPT为代表、堆砌算力和数据的传统AI，DeepSeek大幅降低了技术成本，因此对算力市场形成了强大的冲击。美国时间1月27日，英伟达（Nasdaq：NVDA）股价暴跌16.86%收于每股118.58美元，跌至过去10月以来的最低点；总市值2.90万亿美元，一日蒸发5900亿美元（约合人民币4.28万亿元），创史上最大单日个股市值蒸发纪录。

在英伟达的带领下，美股半导体芯片板块集体受挫，甲骨文下跌13.78%，超微电脑下跌12.49%，芯片制造商博通下跌17.4%，台积电跌13%。随着DeepSeek用更少的芯片、更低的成本实现了高性能的大模型，引发市场对AI科技巨头估值的担忧。

用横空出世、大杀四方来评价DeepSeek并不夸张，比如游戏科学创始人、CEO，《黑神话：悟空》制作人冯骥就将其比作“可能是个国运级别的科技成果”。

从技术原理上来说，DeepSeek的崛起，尤其是最新一代deepseek R1的成功，来自于它所采用的RL强化学习策略，这是它以极低的成本却可以实现和GPT-4o差不多效果的根本原因。

以GPT为代表的传统AI，其策略的本质是"在人类选择下的猜谜游戏"——GPT们其实并不会真正思考，而是通过数据训练，生成一些"看似靠谱实则无法深究"的东西，比如早期绘画AI会把人手画出六个指头，就是因为AI不知道人该有几个指头，只是通过大量的数据训练，能生成一个"大概是这样"的东西。之后再由人类进行筛选，把不靠谱的结果去除掉，才能得到最终的作品。

而对DeepSeek来说，它完全抛弃了这种"猜谜"的训练方式，转而采用了之前在围棋和智能驾驶领域常用的RL策略（强化学习）。如果说以前的策略是人类告诉AI什么是对的什么是错的，那么RL策略，就是真正地让AI学会认识世界、了解事物规律，更加自主地去推理探索。

在传统技术路径下，90%的算力消耗在试错过程中，而Deepseek的自主学习机制能将无效训练降低60%。因为底层技术路线上的颠覆，deepseek R1也把运行成本大大降低——比起硅谷动辄数亿数十亿美金的投资和数万张显卡的超级集群，这个国产大模型仅仅靠着2000多张显卡和600万美元左右的成本就实现了近似乃至更好的效果。

从国产替代、后发超越的角度来说，RL策略对并行计算的需求较传统架构下降40%，直接打破了堆砌算力、数据的美国式AI道路，这使得国产显卡和国产芯片有机会实现对英伟达等海外巨头的替代，冯骥说它有可能影响国运，真是值得我们拭目以待。

上一篇：这一行业人才缺口将达400万，前景如何？下一篇：没有了

果然财经|飞龙在天、大杀四方的DeepSeek，到底有啥魔力

搜索

分类导航

最新文章

热门文章

随机文章

果然财经|飞龙在天、大杀四方的DeepSeek，到底有啥魔力

相关阅读

搜索

分类导航

最新文章

热门文章

随机文章