APP下载
APP二维码
联系我们
APP二维码
返回

DeepSeek-R1大模型全球热度飙升,Arena排名第三,风格控制类与OpenAI o1并列第一

来源:网络   作者:   日期:2025-01-25 19:08:13  

然而,在海外社交媒体甚至华尔街,DeepSeek-R1的热度才刚刚开始螺旋上升。

1月24日,在国外大模型排行榜Arena中,DeepSeek-R1基准测试在大模型所有类别中上升至第三名,在风格控制模型(StyleCtrl)类别中与OpenAI o1并列第一。其arena评分达到1357分,略超OpenAI o1的1352分。

这是继DeepSeek-V3排除OpenAI o1等闭源模型后,DeepSeek-V3在开源模型类别中排名第一后,D​​eepSeek-R1对全球最强大的AI大模型的又一次攻击。

就在Arena发布排名后,全球范围内关于DeepSeek的讨论再次升级。惊叹、钦佩,甚至阴谋论比比皆是。与此同时,美股AI经济的狂欢也在DeepSeek的影响下开始颤抖。

边界类控制类实体类的登录类图__华尔街概念

为美股敲响警钟

就在 DeepSeek-R1 获得风格控制模型得分第一名后,很少发声的图灵奖获得者、Meta AI 首席科学家 Yann LeCun 24 日在社交媒体上表示:当人们看到 DeepSeek 的表现时他们惊呼“中国的AI正在赶上美国”,但这种解读是错误的。更准确的结论是:开源模型正在超越闭源系统。 DeepSeek的成功得益于开放的生态系统,其创新则基于对前期成果的不断迭代。

DeepSeek-R1的发布就像一块重石落入人工智能产业和人工智能投资的湖中。它甚至开始提醒越来越多的人警惕人工智能投资可能存在的泡沫。

美股V“THE SHORT BEAR”在社交媒体上表示,DeepSeek给AI巨头制造了痛苦时刻,投资者必须敲响警钟。

“如果击败OpenAI所需的金额为5500万美元(包括5000个H800 GPU和500万预训练费用),那么这个行业的商业化将比许多人预期的要快得多。”

该博客还指出:“根据红杉资本的说法,美国人工智能公司每年必须产生约 6000 亿美元的收入来支付其人工智能硬件的费用。如果他们不跟进(投资支出)他们就会被淘汰,因此需要大量的资本支出来保持竞争力。这是必要的——但现在看来,这种冒险行为正变得越来越无利可图。”

包括海外媒体Vital Knowledge和德国《Die Welt》知名市场评论员Holger Zschaepitz都一致称DeepSeek是“美国股市的最大威胁”。

海外知名财经博客Zerohedge 24日撰文称,DeepSeek的出现及其廉价的训练成本正在对美国此前宣布的5000亿美元AI基础设施计划造成巨大打击。

在网络社区中,越来越多的人将 DeepSeek 的出现与 NVIDIA 最近的回调联系起来。

1月24日,英伟达股价下跌3.12%至每股142.62美元,这是该公司自年初CES展会上产品未能达到预期表现以来的最大跌幅。

有很多受欢迎的人

DeepSeek 有多受欢迎?海外社交媒体早已给它“花哨的赞誉”,称其不仅便宜,甚至只是对冲基金的副产品(魔方量化)。

当然,右翼分子也不少——其中一个侧面来自于有关DeepSeek阴谋论的不断出现:一些北美AI从业者普遍不相信DeepSeek的预训练成本低于550万美元。

一个极端的例子是人工智能技术初创公司Scale AI的创始人Alexandr Wang。在 2025 年达沃斯论坛上接受采访时,他在没有任何证实的情况下声称 DeepSeek 拥有 5 万个 NVIDIA H100 GPU,但由于芯片禁运并未公开宣布。

一些AI行业人士也怀疑DeepSeek可能存在过拟合基准,在实际使用中可能表现不佳。

“硅谷的AI模型创业者相信这些数字是不现实的,很多人的年薪都比DeepSeek的培训成本还要高。”有人对此发表评论。

幸运的是,DeepSeek 选择了最开放的 MIT 标准作为开源协议。培训成本是否真的那么低还有待观察。

近日,一位匿名Meta员工留言称,Meta最近启动了一项内部努力,通过DeepSeek开源论文重现其大型模型,试图发现它是否真的只需要极低的预训练成本。

到那时,DeepSeek 是否能够真正改变整个 AI 经济的模型架构,或许就已经明朗了。

分类: 股市
责任编辑: admin
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

相关文章:

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。