深度求索DeepSeek-R1与DeepSeek-V3引领AI热潮,全球讨论升级
DeepSeek-R1发布已近一周,开源模型DeepSeek-V3发布也已近一个月。不过,在海外社交媒体平台,甚至华尔街,Deepseek的火爆才刚刚开始。
1月24日,国外大型模型Arena上,DEEPSEEK-R1基准测试已升至第三名,其中风格控制模型(STYLECTRL)类别与Openai O1并列。
就在Arena发布之后,Deepseek的全球讨论再次升级。美国股市的人工智能(AI)狂欢也在Deepseek的影响下开始颤抖。
DEEPSEEK-V3仅用2048个H800 GPU就完成了6710亿参数模型的训练,成本仅为557.6万美元,远低于其他顶级模型(如GPT-4)的训练成本。因此,有人认为DeepSeek可能会颠覆英伟达在AI硬件领域的主导地位。
1月25日,英伟达的“老对手”AMD也迅速公布了AMD Instinct GPU上的全新DeepSeek-V3型号。
美国私募投资基金Noah's Arc Capital Management认为,DeepSeek-V3模型的突破显着降低了AI训练的成本,使AMD GPU成为比Nvidia更具成本效益的替代品,提高了AMD的市场地位。
Deepseek成“美股最大威胁”?
OpenAI的成功来源于“强奇迹”路线,以规模作为大模型的法宝。然而,这也导致大型AI模型的发展陷入怪圈:为了追求更高的性能,模型体量不断膨胀,参数数量呈现指数增长。这种“军备竞赛”的发展模式带来了惊人的能源消耗和培训成本,而且是不可持续的。受大型模型训练成本高昂的拖累,OPENAI 2024 年的损失可能达到 50 亿美元,行业专家预计到 2026 年将进一步攀升至 140 亿美元。
Deepseek的低成本意味着大模型对算力的需求可能会从训练端向推理端倾斜,即未来推理算力的需求将成为主要驱动力。英伟达等硬件厂商的传统优势更多集中在培训端,这可能会影响其市场地位和战略布局。
海外媒体Vital Knowledge、德国知名市场评论员Holger ZSchaepitz均将Deepseek称为“美国股市的最大威胁”。在互联网社区,越来越多的人将DeepSeek与近期英伟达的回调联系在一起——1月24日,英伟达股价下跌3.12%,创下该公司继年初业绩预期后的最大跌幅。
美股V“空头”在社交媒体上表示,Deepseek创造了AI巨头的痛苦时刻,投资者必须敲响警钟。 “根据红杉资本的说法,美国AI公司每年必须创造约6000亿美元的增长来支付其AI硬件成本。
海外知名财经博客Zerohedge 1月24日撰文称,Deepseek的出现及其廉价的训练成本,对美国宣布的5000亿美元AI基础设施计划形成巨大打击。
分析师:英伟达的性能指南至关重要
1月26日(周日),拥有20年行业经验的分析师ITAI Levitan发表题为《中国Deepseek会颠覆英伟达吗?》文章称,英伟达即将发布的财务报告即将至关重要。投资者应密切关注管理层的评论,尤其是有关AI领域竞争风险的评论;如果 Deepseek 是真正的威胁,那么它可能会出现在 Nvidia 性能指南或财务报告中,尤其是在数据中心领域。 ITAI Levitan认为,衡量DeepSeek影响力的最佳方式是观察Nvidia后续股价。
ITAI Levitan指出,如果Nvidia是iPhone,那么Deepseek就是一款“廉价智能手机”。在智能手机行业,廉价替代品的出现无疑改变了苹果的市场份额,尤其是在新兴市场,这对于英伟达也同样适用。不过,这取决于 DeepSeek 能否复制 Nvidia 的生态系统,还是只在价格和性能上竞争。
对此,1月25日,Joser Morgan Chase分析师Joshua Meyers在题为《思考Deepseek的叙述——风险是否真实?》的研究报告中写道,虽然目前还不清楚DeepSeek有多少使用了High-Flyer的约50k Hopper GPU(与OpenAI的GPT-5的集群大小类似),看起来很有可能是的,他们显着降低了成本(例如, DeepSeek的颠覆性主张是“更多的投资并不意味着更多的创新”,而这一主张已经开始在美国AI领域引起关注。
不过,在 Joshua Meyers 看来,这(Deepseek 的低成本)并不意味着扩张(AI 领域)的结束,也不意味着没有更多的计算能力,更不意味着它会获胜(扎克伯格也大大增加了 Meta 的人工) 24 号情报资本支出)。相反,这似乎迫使中国的竞争对手提高效率:“DeepSeek-V2可以实现令人难以置信的训练效率。在所需计算能力的情况下,只有Meta的Llama 3 70B 1/5,其性能优于其他开源比其他开源模型更好。
AMD快“平台”,美国私募:DeepSeek或改写GPU市场格局
就在1月25日(周六),英文达的“老对手”AMD也迅速在AMD Instinctgpu for Deepseek“平台”上做出了新的Deepseek-V3模型,并与SGLANG进行了性能优化。此次融合将有助于加速前沿人工智能应用和体验的开发和体验。
1月21日,美国私募投资基金诺亚方舟资本管理公司发布消息称,DeepSeek-V3模型的突破显着降低了AI训练成本,使AMD GPU成为比Nvidia更具成本效益的替代品,提高了AMD的市场地位。在DeepSeek-V3开发的关键阶段,使用AMD ROCM软件和AMD Instinct GPU加速器进一步巩固与AMD的长期合作。
AMD还表示,将继续优化基于CK-TILE核心的Deepseek-V3在AMD Instinct GPU上的性能。 AMD Instinct 是 AMD 的数据中心 GPU 品牌。 Instinct 产品线面临加速深度学习、人工神经网络和高性能计算/GPGPU 应用。
诺亚方舟资本管理公司认为,AMD今年(2025年)每股收益预计为4.99美元,预计处于AMD历史市盈率的低端。尽管AMD在GPU市场尚未达到其规模,但预计AMD的市场盈利增长将慢于其较大的竞争对手。
此外,AMD还多次上调2024年AI GPU的销售指导,将预测从20亿美元提高到50亿美元。这表明AMD在不断增长的AI GPU市场中的地位正在加速提升。尽管AMD的传统业务(即CPU和GPU)仍然拖累公司估值,但诺亚方舟资本管理认为,随着更轻量级的模型训练和推理集群的建立,这项核心的AI GPU业务将在非常有价值的领域中发挥作用。未来5到10年:“DeepSeek确实改变了GPU集群的设置,AMD应该会从中受益。”
诺亚方舟资本管理公司也指出,Deepseek证明了训练大型模型需要最先进的芯片。 ,AMD的MI 300X GPU在关键参考测试中表现优于H100。因此,Deepseek可以支持AMD GPU上最先进的模型训练。 ”
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。