Grok-3翻车?9.11和9.9哪个大?揭秘AI大模型的数学难题
这是一个数学问题,曾经导致许多大型模型“翻转”。 2月19日,北京时间,马斯克(Musk)发行了Grok-3之后,他声称自己是世界上最聪明的人工智能,用户试图测试该版本,并发现该模型无法在没有任何归因或任何归因的情况下正确地回答困难问题标签。 AI大型模型的经典问题。
在First Financial询问Grok-3之后,AI回答说“ 9.11大于9.9”,直接“翻倒”。但是,一些获得测试资格的用户表示,Grok-3的性能良好,并且绝对是该行业的第一个梯队。
昨天,Xai的Grok-3被正式发布,马斯克称其为“世界上最聪明的人工智能”。 Grok-3出生于一个超大AI智能计算中心,该中心最初配备了100,000元。 NVIDIA的高端图形卡将以随后的身份扩展到200,000元。此前,DeepSeek-V3模型正式宣布,它仅使用了2,000张NVIDIA图形卡和600万美元的预算。
同一天,DeepSeek正式发布了一份有关海外社交平台X的纯技术论文报告,其中主要内容有关NSA(本质上稀疏),进一步证明了DeepSeek团队的软件和硬件优化,降低成本和效率提高了追求。
XAI团队在直播中说:“为了开发下一代高性能AI,我们正在研究下一个AI智能计算中心,该中心将比当前的计算中心强5倍。”不仅XAI,最近的Google,Microsoft和Meta四家外国制造商亚马逊在2025年大大增加了其资本支出,达到了数亿美元,并表示大多数资本支出将用于构建AI智能计算中心。此外,Stargate在今年年初宣布,计划在建设AI智能计算中心的建设上投资5000亿美元。
Daguan Data的联合创始人Zhang Jian告诉记者:“ Grok-3仍然遵循大力产生奇迹的扩展定律。通过堆叠大量的计算能力并增加了模型的规模,它可以追求极端性能的改进。方法可以基于短期的特定评估指标,但成本性能相对较低,它更像是探索模型性能的上限。”
但是,一些从业人员还说,“使奇迹大力创造奇迹”的想法还有很长的路要走,并认为Xai是在短时间内建立的,可以在短时间内达到一流的表现水平时间,表明卷的计算能力仍然很有价值。 。
Wei Haochuangxin合作伙伴Wang Zhi此前曾告诉记者,AI正在发展到未来,从长远来看,更多的新建筑和算法是必不可少的。
但是,越来越多的人开始质疑“强大奇迹”的方向。一些评论说,仅查看基准测试,尽管Grok-3领导了各种数据,但改进并不大,尤其是考虑到Xai花了很多钱来培训Grok-3。
“马斯克的AI智能计算集群解决方案非常激进,这不仅需要大规模的资本投资,而且还需要快速部署和快速发射。” OMDIA分析师Wang Shen告诉记者。
张简认为,无论是DeepSeek还是Grok3,这两个方向都不完全相反,而是有自己的重点,并且可以长时间共存并逐渐融入技术发展。 “ Grok 3代表了对性能限制的探索,而DeepSeek代表了追求实用性和效率的追求。两者共同促进了AI技术的发展,最终目标是建立一个更强大,更聪明,更实用的AI系统。”张大说。
王山认为,这两个方向的重点可能是顺序的。 “我们的团队认为,在2026年至2027年之间,AI智能计算中心的堆栈计算功率峰会将通过,然后将进行各种硬件和模型的深入优化和抛光。由于硬件限制,中国将强调优化优化较早。”
上海人工智能行业协会秘书长中总部对记者说:“这两个方向都很重要,但是优先级存在差异。探索绩效限制是基础,并且必须基于前者的实用性和效率的方向。”
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。