APP下载
APP二维码
联系我们
APP二维码
返回

中国AI初创公司深度求索发布两款大模型,性能媲美OpenAI,引发硅谷震惊与Meta内部恐慌

来源:网络   作者:   日期:2025-01-26 09:08:35  

Scale AI创始人亚历山大·王(Alexander Wang)在1月24日的一次采访中说,DeepSeek在测试中表现最好,并且与美国最佳模型相当。

以前,亚历山大·王(Alexander Wang)评论说,DeepSeek-V3是中国技术界带给美国的痛苦教训。 “尽管美国休息,但中国(科技界)正在努力,赶上了较低的成本,更快的速度和更高的实力。”

此外,中国的AI“粉碎了主要外国媒体的屏幕”。他们认为,中国大型模型的新进展听起来像是对硅谷的警钟。

随着5000亿美元的“星际之门”项目宣布,DeepSeek以非常低的价格建立了突破性的AI模型,而无需使用尖端的筹码,质疑AI行业的数亿美元的资本投资。 。这真的是最有效的方法吗?

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式_“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式_

元进入恐慌模式并试图复制DeepSeek

1月24日,在匿名平台TeamBlind上发布的一篇文章流行了。一位元员工说,由于DeepSeek的模型,Meta进入了恐慌模式。

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式_“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式_

这个元员工写道:

这一切都源于DeepSeek-V3的出现,后者已经在基准测试中缩短了Llama 4。更令人尴尬的是,一家“中国公司只有550万美元的培训预算”做到了这一点。

工程师正在与时间竞争,以分析DeepSeek并尝试复制其中的所有可能技术。这不是夸张。

管理层担心Genai的研发部门的巨额投资。当部门的一名高管的薪水超过了整个DeepSeek V3的培训成本,并且有数十个高管时,他们应该如何向高级管理层解释?

DeepSeek-R1的出现使情况变得更加严重。具体细节是机密的,不能披露,但是它们很快就会公开。

去年12月27日,DeepSeek推出了开源模型DeepSeek-V3。当时,聊天机器人体育馆表明,DeepSeek-V3在所有型号中排名第七,在开源模型中排名第一。此外,DeepSeek-V3是世界前十名中最具成本效益的模型。

不到一个月后,即今年1月20日,DeepSeek正式开放了R1推理模型,使每个人都可以提炼R1根据MIT许可进行培训其他型号(注意:广泛使用的软件许可条款)。

1月24日,DeepSeek-R1在全面的聊天机器人竞技场列表中排名第三,并与最高推理模型O1列为。

在高度技术领域(例如较难的迅速单词,代码和数学)等领域中,DeepSeek-R1排名第一,排名第一。

在样式控制方面,DeepSeek-R1与O1并列第一,这意味着该模型在理解和遵循用户说明并以特定样式生成内容方面表现良好。

在将困难的及时单词与样式控制结合在一起的测试中,DeepSeek-R1和O1也列为第一名,进一步证明了其在复杂任务和精致控制中的强大功能。

_“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式_“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式

DeepSeek-R1的人工分析的初始基准结果还表明,DeepSeek-R1在AI分析质量指数中获得了第二高分,而且价格约为O1的三分之一。

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式__“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式

AI Boss Marvels:中国的AI赶上了美国

AI数据服务公司Scare AI的创始人Alexander Wang于去年12月发布DeepSeek-V3后,表示DeepSeek-V3是中国技术界向美国教授的痛苦教训。 “尽管美国休息,但中国(科技界)正在努力,赶上了较低的成本,更快的速度和更高的实力。”

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式__“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式

著名投资公司A16Z的创始人马克·安德森(Marc Andreessen)于1月24日发布,DeepSeek-R1是他见过的最令人惊叹,最令人印象深刻的突破之一。它也是开源的,是针对世界的。礼物。

_“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式_“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式

1月24日,A16Z的合伙人,Mistral AI董事会成员Anjney Midha说:“从斯坦福大学到麻省理工学院,DeepSeek-R1已成为美国顶级大学研究人员的首选典范过夜。”

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式_“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式_

关于为什么中国的AI取得如此迅速的进步,诺贝尔奖获得者和“ AI的教父” Jeffrey Hinton在1月21日对博客作者Curt Jaimungal的独家采访中说,中国的STEM(科学,技术,工程,工程学)比教育更好在美国,拥有更受过良好教育的才能,这将为AI的发展奠定坚实的基础。尽管美国试图通过限制(例如NVIDIA芯片)来减缓中国的发展,但这只会促使中国加速其自己技术的发展。 “他们可能落后几年,但最终会赶上。”

DeepSeek可能会完全改变游戏规则。 “力量可以带来奇迹”仍然有效吗?

斯坦福大学和Epoch AI的研究人员在去年中期发表了一项研究,表明培训最大的模型到2027年的成本将超过10亿美元。Gartner预测,到2028年,Google,Microsoft和AWS等超大规模公司将花费为2028年。仅在AI服务器上只有5000亿美元。

但是DeepSeek完全不同,并且其培训成本并不昂贵。诺亚(Noah)的ARC Capital Management表示,DeepSeek-V3模型有可能在训练和推理中彻底改变游戏。

特别是在宣布了5000亿美元的“星际之门”计划之后,DeepSeek使人们更加怀疑。这种“对奇迹的大投资”方法真的是最有效的方法吗?

美国股票市场v的“短熊”于1月24日在X上发布,DeepSeek为AI巨人和投资者带来了痛苦的时刻,必须发出警报。

他说:“如果只需要5500万美元才能击败Openai,那么这个行业的商业化将比许多人预期的要快得多。”

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式_“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式_

他还指出:“根据红杉的说法,美国AI公司每年必须每年产生约6000亿美元的收入才能支付其AI硬件。现在看来,这种风险行为正变得越来越无利可图。”

著名的财务记者霍格·兹切普茨(Holger Zschaepitz)在1月25日表示,DeepSeek以极低的价格建立了突破性的AI模型,并且不使用尖端筹码,这使该行业在资本支出中质疑该行业数十亿美元的有效性。

_“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式_“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式

一些投资者甚至认为,美国芯片股票的股价也将面临挑战。

投资者Geiger Capital表示,DeepSeek与Openai一样好,甚至更好,而价格仅占后者的3%……而美国公司已经投资了数亿美元。那么...纳斯达克怎么办?

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式_“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式_

值得注意的是,在DeepSeek-V3发行后,NVIDIA的股价下跌了2%。在DeepSeek-R1引发了海外的大规模讨论之后,NVIDIA的股价在1月24日下跌了3.12%。

外国媒体集体淹没了屏幕:硅谷的警钟

如果DeepSeek-v3只是波浪,那么DeepSeek-R1引起了感觉。在过去的四天中,外国媒体专注于DeepSeek,并同意中国大型模型的新进展听起来像是硅谷的警钟。

1月22日,美国媒体业务内部人士报告说,DeepSeek-R1模型遵循开放的精神,完全是开源的,这给美国A​​I球员带来了麻烦。开源Advanced AI可能会挑战试图通过销售技术赚取巨额利润的公司。

_“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式_“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式

1月24日,美国媒体CNBC启动了一项40分钟的计划,并邀请困惑首席执行官Aravind Srinivas分析了为什么DeepSeek引起了人们对美国在AI领域的全球领导能力的担忧。

《金融时报》在1月25日报道说,一家小型中国人工智能初创公司DeepSeek震惊了硅谷。该报告的重点是拥有更多资源的美国AI公司是否可以捍卫其技术优势。

“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式__“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷 巨头进入恐慌模式

该报告引用了加州大学伯克利分校的AI政策研究员Ritwik Gupta,他说DeepSeek最近发布的模型表明“ AI功能没有护城河”。古普塔补充说,中国系统工程师的人才库比美国大得多,他们了解如何使计算资源充分利用计算资源来更便宜地培训和运行模型。

分类: 股市
责任编辑: admin
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

相关文章:

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。