果然财经|飞龙在天、大杀四方的DeepSeek,到底有啥魔力
齐鲁晚报·齐鲁壹点记者 张頔
在农历龙年的最后几天,横空出世的DeepSeek如飞龙在天,给了全球科技界“亿点点”震撼。
DeepSeek是量化巨头幻方量化旗下大模型公司,1月20日,该公司正式发布推理大模型DeepSeek-R1。1月27日,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
因为底层技术路线上颠覆了以GPT为代表、堆砌算力和数据的传统AI,DeepSeek大幅降低了技术成本,因此对算力市场形成了强大的冲击。美国时间1月27日,英伟达(Nasdaq:NVDA)股价暴跌16.86%收于每股118.58美元,跌至过去10月以来的最低点;总市值2.90万亿美元,一日蒸发5900亿美元(约合人民币4.28万亿元),创史上最大单日个股市值蒸发纪录。
在英伟达的带领下,美股半导体芯片板块集体受挫,甲骨文下跌13.78%,超微电脑下跌12.49%,芯片制造商博通下跌17.4%,台积电跌13%。随着DeepSeek用更少的芯片、更低的成本实现了高性能的大模型,引发市场对AI科技巨头估值的担忧。
用横空出世、大杀四方来评价DeepSeek并不夸张,比如游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥就将其比作“可能是个国运级别的科技成果”。
从技术原理上来说,DeepSeek的崛起,尤其是最新一代deepseek R1的成功,来自于它所采用的RL强化学习策略,这是它以极低的成本却可以实现和GPT-4o差不多效果的根本原因。
以GPT为代表的传统AI,其策略的本质是"在人类选择下的猜谜游戏"——GPT们其实并不会真正思考,而是通过数据训练,生成一些"看似靠谱实则无法深究"的东西,比如早期绘画AI会把人手画出六个指头,就是因为AI不知道人该有几个指头,只是通过大量的数据训练,能生成一个"大概是这样"的东西。之后再由人类进行筛选,把不靠谱的结果去除掉,才能得到最终的作品。
而对DeepSeek来说,它完全抛弃了这种"猜谜"的训练方式,转而采用了之前在围棋和智能驾驶领域常用的RL策略(强化学习)。如果说以前的策略是人类告诉AI什么是对的什么是错的,那么RL策略,就是真正地让AI学会认识世界、了解事物规律,更加自主地去推理探索。
在传统技术路径下,90%的算力消耗在试错过程中,而Deepseek的自主学习机制能将无效训练降低60%。因为底层技术路线上的颠覆,deepseek R1也把运行成本大大降低——比起硅谷动辄数亿数十亿美金的投资和数万张显卡的超级集群,这个国产大模型仅仅靠着2000多张显卡和600万美元左右的成本就实现了近似乃至更好的效果。
从国产替代、后发超越的角度来说,RL策略对并行计算的需求较传统架构下降40%,直接打破了堆砌算力、数据的美国式AI道路,这使得国产显卡和国产芯片有机会实现对英伟达等海外巨头的替代,冯骥说它有可能影响国运,真是值得我们拭目以待。