政策暖风频吹,H100 GPU 泡沫破灭,替代品出现,市场格局生变
近日,一则《H100 2美元/小时租赁:GPU泡沫破灭前夕》的报道引起国内市场高度关注。相关文章指出:
2023年3月NVIDIA H100 GPU推出后,由于需求激增,租赁价格从最初的每小时4.7美元飙升至每小时8美元以上。但今年以来,H100开始“供过于求”,每小时租金价格已降至2美元左右。
价格下降的原因有很多:1)一些长期预订H100的公司在完成模型训练后转售闲置未使用的算力; 2)许多公司不再从头开始训练新模型,而是微调开放模型并利用计算能力。需求大幅下降; 3)专注于打造大型基础模型的新创企业数量大幅下降; 4)H100替代品已经出现,例如AMD和Intel GPU等。
追查这份报道的来源可以发现,海外主流媒体和各大科技媒体尚未进行相关报道。最初的报告标题为“2美元H100s:GPU泡沫如何破裂”($2 H100s:GPU泡沫如何破裂)。来自一个名为 Latent Space 的网站,原作者是 Eugene Cheah。
据该网站介绍,Latent Space主要专注于人工智能。它集成了内容信息、博客和社区。它由 swyx 和 Alessio Fanelli 共同主持。前者的社交平台账号没有给出具体身份来介绍自己,而后者则是一名早期粉丝。投资公司Decibel VC的合伙人兼CTO。
原作者 Eugene Cheah 是初创公司 Featherless.Ai 的首席执行官。
根据 Cheah 在原文章《GPU Bubble》末尾的介绍,Featherless.Ai 目前托管着全球最大的开源 AI 模型,“每月 10 美元起,立即访问、无限请求、固定价格;通过 Serverless 进行即时推理”方法,而不需要昂贵的专用 GPU。”
▌H100租金降价=GPU泡沫破灭?
原文《GPU泡泡》附有一张图片,是法国艺术家Jean-Léon Gérôme于1882年创作的油画《郁金香狂热》(Le Duel à la tulipe)。
这幅画描绘了历史上第一次投机泡沫——17世纪荷兰的“郁金香狂热”。 1634年郁金香价格持续上涨,1637年2月暴跌,投机者手中只剩下原始投资。金额的5%。
三百多年前的投机泡沫还会重演吗?这个问题牵动着每一个AI投资者的神经,也可能是此次《H100租金降价》文章引起高度关注的原因。
从算力租赁提供商Vast.ai网站上的报价可以看出,1x H100的一小时租赁报价确实在2到3美元之间。
但H100租赁价格的下降真的能等同于“GPU泡沫破裂”吗?
一方面,从Eugene Cheah的文章来看,“H100价格下降”或许用“分化”来形容更恰当——持续下降主要集中在小规模集群的租金价格上。相比之下,大规模算力集群的价格很可能会维持在较高水平。
这些大规模计算集群的背后大多是特斯拉、微软、OpenAI等科技巨头。 Omidia数据显示,H100发布后的2023年第三季度,其出货量达到65万台,其中仅Meta和微软就各拿了15万台,占比接近一半。
另一方面,电子产品都有更新迭代的周期,GPU芯片也是如此。此前有消息称,英伟达下一代GPU Blackwell系列存在设计缺陷,可能会延迟发货。但摩根士丹利上周报告称,Blackwell 的生产“步入正轨”,未来 12 个月左右的供应量已售罄,这意味着现在下订单的客户要到 2025 年底才能收到货物。推动对现有 Hopper 架构产品的强劲近期需求。”
H100的租金价格并不是突然暴跌,而是已经波动了一段时间了。从A100到H100,从H100到H200,再到未来的Blackwell,新品的发布必然带来上一代产品的衰落,甚至有消息称Blackwell的算力成本有望进一步降低比霍珀。
英伟达“掌舵人”黄仁勋近日也现身发声。在接受Altimeter Capital采访时,他强调,对英伟达的持续看好与互联网泡沫顶峰时期围绕思科的热潮完全不同。 NVIDIA正在“重塑计算”,未来将是“高级机器学习”的时代。
“摩尔定律基本上已经结束了,”他说。为了提供必要的计算能力来跟上未来计算密集型软件的步伐,现有数据中心在未来 4 到 5 年内将需要价值约 1 万亿美元的 GPU。实施升级。
必须承认,“人工智能泡沫”论的警钟一再敲响,“人工智能投资回报难以达到预期”的质疑声也越来越大。一方面,OpenAI抱怨算力推出不及时、不够用,英伟达新品销量低迷。另一方面,算力租赁价格持续下降,企业“贱卖”GPU。
但局部、短期的算力过剩或短缺似乎难以代表AI的整体情况。对于供需、多空双方争先恐后的AI领域来说,可能迫切需要更多硬件端之外的新故事。
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。