2025年AI大战加速：深度求索DeepSeek-R1发布，全面对标OpenAI大模型o1

来源：网络作者：日期：2025-01-22 05:33:29

1月20日，距离DeepSeek-V3发布仅26天，深度搜索公司再次发布了深度推理版本的DeepSeek-R1。

该版本被认为完全可以与OpenAI发布的大型模型o1相媲美，以及更轻但推理速度更快的o1-mini。

由于DeepSeek此前发布的DeepSeek-V3已经展现出强大的推理和数学能力，因此R1的推出被普遍认为是水到渠成的结果。

然而，DeepSeek-R1项目所展现出的创造力和突破仍然超出了大多数从业者的预期——例如，他们使用了更纯粹的强化学习（RL）技术，颠覆性地消除了模型预启动的需要。传统的人类赋权认知真正让AI开始像人类一样思考。

无独有偶，在DeepSeek-R1发布的同一天，国内另一大模型“网红”Kimi发布了多模态思维模型“k1.5”，明确瞄准o1实现多模态推理能力。

两家中国AI公司占据领先地位，很可能会被包围和打压——而OpenAI首席执行官萨姆·奥尔特曼似乎并不孤单。

当天，奥特曼再次在社交媒体上宣布，其推理模型o3和o3 mini将在几周后发布。根据OpenAI去年的声明，o3模型的能力将接近实现AGI（通用人工智能）。

不过，奥特曼的表态还是被不少网友调侃“OpenAI又在卖期货了”。

2025年刚刚开始，随着大型AI模型的激烈竞争，攻防趋势悄然发生变化。

明确基准o1

去年9月，OpenAI发布了划时代的o1模型。

o1模型有两大标签，一是令人印象深刻的推理和理化分析能力，二是首次将多模态（例如图片、声音等混合输入）与推理相结合。

然而1月20日，OpenAI o1模型的两大支柱明显被国内两位AI新秀发布的新模型对标。

在DeepSeek-R1之前，DeepSeek已经有了基于推理能力的DeepSeek-R1 Lite。然而，DeepSeek-R1发布后，大家发现它的惊艳程度丝毫不亚于DeepSeek V2、V3迭代带来的惊喜。

在知名AI能力评测机构LiveBench上，DeepSeek-R1综合得分已达到全球第二位，仅次于俗称“满血版”的OpenAI o1，比第一代高出四位。 DeepSeek-V3的排名。

在DeepSeek官网上，记者发现，DeepSeek-R1网页版的功能被集成到了V3的“深度思考”通话功能按钮中。同时，在交互过程中，DeepSeek-R1会用浅色小字来呈现模型的推理链——这与被视为推理模型大师的o1类似。

一位尝试过的人工智能工程师描述了 DeepSeek-R1 丝滑的感觉。

“在使用其他人工智能的过程中，你仍然会感觉到它们在不断地搜索、拼接信息和数据，无论是推理还是做数学题。但DeepSeek-R1给我的感觉是它真的很像一个人——甚至人都会犯错误，因为人都会犯错误。”

当然，DeepSeek-R1 无法完全对标 o1，因为到目前为止它仍然专注于单模态推理。然而，多模态推理是由Kimi发布的k1.5模型完成的，该模型在新模型发布中遭遇了“撞车”，并与DeepSeek一样有“C级首发”的表现。

一系列权威评测结果表明，k1.5无论是在纯文本还是视觉多模态的数学能力上都超过了o1，在短篇推理上也超过了GPT-4o和Claude 3.5-sonnet。

无论是DeepSeek-R1还是Kimi k1.5，都在公开开发文档中透露，它们使用类似的强化学习（RL）能力来提高模型的能力，而无需人工干预和监控。

一位用户名为“Flood Sung”的Kimi工程师在社交平台上表达了他对英雄们有着相似观点的惊讶：

“令人惊讶的是，在我们的实际训练过程中，我们有了一个重要的发现……这与我们的朋友 DeepSeek 的发现几乎相同。”洪洪说道：“我感觉自己像个人工智能，哦不，是因为人工智能太像人类了。”

国产AI来袭稍后

大约一年前，AI行业名人、OpenAI联合创始人、特斯拉自动驾驶研发负责人安德烈·卡帕蒂(Andrej Karpathy)誓言英语是AI最常用的语言。

当然，这个格局至今还没有改变。在使用DeepSeek-V3时，有人发现模型返回的结果往往是用全英文表达的。包括DeepSeek-R1一夜之间发布后，很多人发现R1在推理过程中时不时地显示英文。

而正当大家以为DeepSeek和Kimi都站在OpenAI的肩膀上时，OpenAI o1的推理过程中却同时出现了中文。

DeepSeek-V3刚发布不久，就有网友发现自己使用的o1 Pro会随机思考中文。有专家认为，除了更加简洁高效的汉字之外，由于当前训练集大量包含中文，也使得o1模型能够使用更有效的中文进行推理。

这至少证明英文和中文的AI内容已经开始相互影响。

与DeepSeek-V3类似，R1的发布也引发了网络上的热议。

NVIDIA AI 负责人 Fan Jim 在社交媒体上再次表达了对 DeepSeek-R1 模型的感叹：

“我们生活在一个非美国公司正在履行 OpenAI 最初使命的时代——真正开放、赋能每个人的前沿研究，”Fan Jim 说道：“DeepSeek-R1 不仅是开源的，他们还展示了所有训练。”

与此同时，包括加州大学伯克利分校教授Alex Dimakis、Abacus ai首席执行官Bindu Reddy等人都表达了感叹，中国的AI正在迎头赶上，但美国的AI企业还需要努力。

种种迹象表明，国内AI正在以迅雷不及掩耳之势融入AI世界。

分类： 股市

地址： http://news.lianzhou.cn/post/7044.html

标签：2025AI大战 DeepSeek-R1 Kimi 多模态强化学习

责任编辑： admin

近日华为公布AI基础设施架构新进展，CloudMatrix 384超节点或终结算力焦虑

特斯拉Optimus人形机器人最新视频曝光：强化学习训练下的稳健步态与自然动作

DeepSeek发布V3-0324模型更新，6850亿参数开源版上线Hugging Face

百度发布文心大模型4.5及X1：多模态理解能力显著提升，性能优于GPT4.5

北京研发团队展示连续后空翻人形机器人N2，技术创新提升稳定性

大模型技术与具身智能结合：推动机器人向更智能形态发展的重要突破

潞晨科技宣布停止DeepSeek API服务，用户需尽快使用余额或申请退款

潞晨科技宣布停止DeepSeek API服务，用户需尽快用完余额并享受全额退款

潞晨科技宣布停止DeepSeek API服务，用户余额将全额退款

DeepSeek开源优化并行策略与英伟达Blackwell架构的DeepSeek-R1模型，实现计算效率与推理速度的大幅提升

DeepSeek API夜间优惠活动：DeepSeek-V3降至50%，DeepSeek-R1低至25%

中国联通利用DeepSeek-R1满血版模型实现难度自适应微调与二次蒸馏优化

微信Windows 4.0.2测试版上线，电脑端可收取红包，腾讯AI应用前景看好

联想AI PC新品发布：天禧AS系统升级，端侧部署DeepSeek 7B大模型引领行业创新

小米超级小爱再升级：DeepSeek-R1模型助力代码编写与文章创作

马斯克Grok语音模式上线，AI集群构建加速，全球AI大战愈演愈烈

月之暗面收缩预算引发市场关注，AI六小虎未来何去何从？DeepSeek崛起加剧基础大模型赛道竞争

2024年中国智能算力规模增长74.1%，市场规模达190亿美元

发表评论取消回复

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。

2025年AI大战加速：深度求索DeepSeek-R1发布，全面对标OpenAI大模型o1

相关文章：

发表评论 取消回复

发表评论取消回复