DeepSeek-R1大模型全球热度飙升,Arena排名第三,风格控制类与OpenAI o1并列第一
然而,在海外社交媒体甚至华尔街,DeepSeek-R1的热度才刚刚开始螺旋上升。
1月24日,在国外大模型排行榜Arena中,DeepSeek-R1基准测试在大模型所有类别中上升至第三名,在风格控制模型(StyleCtrl)类别中与OpenAI o1并列第一。其arena评分达到1357分,略超OpenAI o1的1352分。
这是继DeepSeek-V3排除OpenAI o1等闭源模型后,DeepSeek-V3在开源模型类别中排名第一后,DeepSeek-R1对全球最强大的AI大模型的又一次攻击。
就在Arena发布排名后,全球范围内关于DeepSeek的讨论再次升级。惊叹、钦佩,甚至阴谋论比比皆是。与此同时,美股AI经济的狂欢也在DeepSeek的影响下开始颤抖。
为美股敲响警钟
就在 DeepSeek-R1 获得风格控制模型得分第一名后,很少发声的图灵奖获得者、Meta AI 首席科学家 Yann LeCun 24 日在社交媒体上表示:当人们看到 DeepSeek 的表现时他们惊呼“中国的AI正在赶上美国”,但这种解读是错误的。更准确的结论是:开源模型正在超越闭源系统。 DeepSeek的成功得益于开放的生态系统,其创新则基于对前期成果的不断迭代。
DeepSeek-R1的发布就像一块重石落入人工智能产业和人工智能投资的湖中。它甚至开始提醒越来越多的人警惕人工智能投资可能存在的泡沫。
美股V“THE SHORT BEAR”在社交媒体上表示,DeepSeek给AI巨头制造了痛苦时刻,投资者必须敲响警钟。
“如果击败OpenAI所需的金额为5500万美元(包括5000个H800 GPU和500万预训练费用),那么这个行业的商业化将比许多人预期的要快得多。”
该博客还指出:“根据红杉资本的说法,美国人工智能公司每年必须产生约 6000 亿美元的收入来支付其人工智能硬件的费用。如果他们不跟进(投资支出)他们就会被淘汰,因此需要大量的资本支出来保持竞争力。这是必要的——但现在看来,这种冒险行为正变得越来越无利可图。”
包括海外媒体Vital Knowledge和德国《Die Welt》知名市场评论员Holger Zschaepitz都一致称DeepSeek是“美国股市的最大威胁”。
海外知名财经博客Zerohedge 24日撰文称,DeepSeek的出现及其廉价的训练成本正在对美国此前宣布的5000亿美元AI基础设施计划造成巨大打击。
在网络社区中,越来越多的人将 DeepSeek 的出现与 NVIDIA 最近的回调联系起来。
1月24日,英伟达股价下跌3.12%至每股142.62美元,这是该公司自年初CES展会上产品未能达到预期表现以来的最大跌幅。
有很多受欢迎的人
DeepSeek 有多受欢迎?海外社交媒体早已给它“花哨的赞誉”,称其不仅便宜,甚至只是对冲基金的副产品(魔方量化)。
当然,右翼分子也不少——其中一个侧面来自于有关DeepSeek阴谋论的不断出现:一些北美AI从业者普遍不相信DeepSeek的预训练成本低于550万美元。
一个极端的例子是人工智能技术初创公司Scale AI的创始人Alexandr Wang。在 2025 年达沃斯论坛上接受采访时,他在没有任何证实的情况下声称 DeepSeek 拥有 5 万个 NVIDIA H100 GPU,但由于芯片禁运并未公开宣布。
一些AI行业人士也怀疑DeepSeek可能存在过拟合基准,在实际使用中可能表现不佳。
“硅谷的AI模型创业者相信这些数字是不现实的,很多人的年薪都比DeepSeek的培训成本还要高。”有人对此发表评论。
幸运的是,DeepSeek 选择了最开放的 MIT 标准作为开源协议。培训成本是否真的那么低还有待观察。
近日,一位匿名Meta员工留言称,Meta最近启动了一项内部努力,通过DeepSeek开源论文重现其大型模型,试图发现它是否真的只需要极低的预训练成本。
到那时,DeepSeek 是否能够真正改变整个 AI 经济的模型架构,或许就已经明朗了。
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。