APP下载
APP二维码
联系我们
APP二维码
返回

2025年AI大战加速:深度求索DeepSeek-R1发布,全面对标OpenAI大模型o1

来源:网络   作者:   日期:2025-01-22 05:33:29  

1月20日,距离DeepSeek-V3发布仅26天,深度搜索公司再次发布了深度推理版本的DeepSeek-R1。

该版本被认为完全可以与OpenAI发布的大型模型o1相媲美,以及更轻但推理速度更快的o1-mini。

由于DeepSeek此前发布的DeepSeek-V3已经展现出强大的推理和数学能力,因此R1的推出被普遍认为是水到渠成的结果。

然而,DeepSeek-R1项目所展现出的创造力和突破仍然超出了大多数从业者的预期——例如,他们使用了更纯粹的强化学习(RL)技术,颠覆性地消除了模型预启动的需要。传统的人类赋权认知真正让AI开始像人类一样思考。

无独有偶,在DeepSeek-R1发布的同一天,国内另一大模型“网红”Kimi发布了多模态思维模型“k1.5”,明确瞄准o1实现多模态推理能力。

两家中国AI公司占据领先地位,很可能会被包围和打压——而OpenAI首席执行官萨姆·奥尔特曼似乎并不孤单。

当天,奥特曼再次在社交媒体上宣布,其推理模型o3和o3 mini将在几周后发布。根据OpenAI去年的声明,o3模型的能力将接近实现AGI(通用人工智能)。

不过,奥特曼的表态还是被不少网友调侃“OpenAI又在卖期货了”。

2025年刚刚开始,随着大型AI模型的激烈竞争,攻防趋势悄然发生变化。

明确基准o1

去年9月,OpenAI发布了划时代的o1模型。

o1模型有两大标签,一是令人印象深刻的推理和理化分析能力,二是首次将多模态(例如图片、声音等混合输入)与推理相结合。

然而1月20日,OpenAI o1模型的两大支柱明显被国内两位AI新秀发布的新模型对标。

在DeepSeek-R1之前,DeepSeek已经有了基于推理能力的DeepSeek-R1 Lite。然而,DeepSeek-R1发布后,大家发现它的惊艳程度丝毫不亚于DeepSeek V2、V3迭代带来的惊喜。

在知名AI能力评测机构LiveBench上,DeepSeek-R1综合得分已达到全球第二位,仅次于俗称“满血版”的OpenAI o1,比第一代高出四位。 DeepSeek-V3的排名。

在DeepSeek官网上,记者发现,DeepSeek-R1网页版的功能被集成到了V3的“深度思考”通话功能按钮中。同时,在交互过程中,DeepSeek-R1会用浅色小字来呈现模型的推理链——这与被视为推理模型大师的o1类似。

一位尝试过的人工智能工程师描述了 DeepSeek-R1 丝滑的感觉。

“在使用其他人工智能的过程中,你仍然会感觉到它们在不断地搜索、拼接信息和数据,无论是推理还是做数学题。但DeepSeek-R1给我的感觉是它真的很像一个人——甚至人都会犯错误,因为人都会犯错误。”

当然,DeepSeek-R1 无法完全对标 o1,因为到目前为止它仍然专注于单模态推理。然而,多模态推理是由Kimi发布的k1.5模型完成的,该模型在新模型发布中遭遇了“撞车”,并与DeepSeek一样有“C级首发”的表现。

一系列权威评测结果表明,k1.5无论是在纯文本还是视觉多模态的数学能力上都超过了o1,在短篇推理上也超过了GPT-4o和Claude 3.5-sonnet。

无论是DeepSeek-R1还是Kimi k1.5,都在公开开发文档中透露,它们使用类似的强化学习(RL)能力来提高模型的能力,而无需人工干预和监控。

一位用户名为“Flood Sung”的Kimi工程师在社交平台上表达了他对英雄们有着相似观点的惊讶:

“令人惊讶的是,在我们的实际训练过程中,我们有了一个重要的发现……这与我们的朋友 DeepSeek 的发现几乎相同。”洪洪说道:“我感觉自己像个人工智能,哦不,是因为人工智能太像人类了。”

国产AI来袭稍后

大约一年前,AI行业名人、OpenAI联合创始人、特斯拉自动驾驶研发负责人安德烈·卡帕蒂(Andrej Karpathy)誓言英语是AI最常用的语言。

当然,这个格局至今还没有改变。在使用DeepSeek-V3时,有人发现模型返回的结果往往是用全英文表达的。包括DeepSeek-R1一夜之间发布后,很多人发现R1在推理过程中时不时地显示英文。

而正当大家以为DeepSeek和Kimi都站在OpenAI的肩膀上时,OpenAI o1的推理过程中却同时出现了中文。

DeepSeek-V3刚发布不久,就有网友发现自己使用的o1 Pro会随机思考中文。有专家认为,除了更加简洁高效的汉字之外,由于当前训练集大量包含中文,也使得o1模型能够使用更有效的中文进行推理。

这至少证明英文和中文的AI内容已经开始相互影响。

与DeepSeek-V3类似,R1的发布也引发了网络上的热议。

NVIDIA AI 负责人 Fan Jim 在社交媒体上再次表达了对 DeepSeek-R1 模型的感叹:

“我们生活在一个非美国公司正在履行 OpenAI 最初使命的时代——真正开放、赋能每个人的前沿研究,”Fan Jim 说道:“DeepSeek-R1 不仅是开源的,他们还展示了所有训练。”

与此同时,包括加州大学伯克利分校教授Alex Dimakis、Abacus ai首席执行官Bindu Reddy等人都表达了感叹,中国的AI正在迎头赶上,但美国的AI企业还需要努力。

种种迹象表明,国内AI正在以迅雷不及掩耳之势融入AI世界。

分类: 股市
责任编辑: admin
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。