DeepSeek V3-0324模型升级:推理、前端开发、中文写作与搜索能力全面提升,超越Grok3和GPT-4.5
最新进度!
3月25日晚上,DeepSeek另一个大新闻。该公司正式宣布了V3模型已完成其官方帐户的小型升级的消息,并介绍了新版本的DeepSeek-V3-0324型号的改进的详细信息,包括推理,前端发展,中文写作和中国搜索方面的能力优化。根据海外专业AI模型评估机构的最新排名,V3模型的新版本现在是评分最高的非推理模型,超过了XAI的GROK3和OpenAI的GPT-4.5(Preview)。
值得注意的是,昨晚北京时代,人工智能模型之间存在着连续的“秘密战斗”。 3月25日,当地时间,开放人工智能研究中心(OpenAI)宣布启动4O图像生成功能,“将迄今为止最先进的图像生成器集成到GPT-4O中”。 Google还发布了Gemini 2.5系列人工智能推断模型。它的第一个版本Pro实验性在首次亮相后立即获得了大型赛场的第一名,并且比GPT-4.5高40分。
再次引爆:再次变得更强壮!
3月25日晚上,DeepSeek宣布V3型号已完成了小型版本的升级。当前版本编号为DeepSeek-V3-0324。用户登录到官方网页,应用程序和迷你程序以输入对话接口,关闭深思熟虑并体验它。
据报道,DeepSeek-V3-0324 API接口和使用方法保持不变。如果您没有复杂的推理任务,建议使用新版本的V3型号立即享受更流畅的速度和全面改进的对话体验。
模型推理任务的性能有所提高。新的V3模型借鉴了DeepSeek-R1模型训练过程中使用的强化学习技术,该技术极大地提高了推理任务的性能,并且在数学和代码相关的评估集中的得分超过了GPT-4.5。
DeepSeek-V3-0324使用与以前的DeepSeek-V3相同的基本模型,并且仅改善了训练后方法。部署私有时,您只需要更新检查点和Tokenizer_Config.json(工具调用相关的更改)。模型参数约为660B,开源版本上下文长度为128K(由网页,应用程序和API提供64K上下文)。
但是,外界对DeepSeek-V3-0324的关注不仅是因为此版本的功能的提高,而且还猜测其发布是否意味着DeepSeek的新一代V4和R2模型的发布并不远远不能释放。
DeepSeek说,首先,新版本的代码能力得到了显着提高,接近Claude 3.7的水平。例如,一些在实际测试中发现的用户可以一次生成800行无错误的Web代码,并实现动态响应式布局和交互式效果。其次,推理数学和逻辑上的推理能力已得到增强。例如,经典的“四升水壶问题”和数学竞赛问题(例如Aime 2025问题),其中一些类似于专业推理模型。第三个是模型体系结构和开源生态系统。 V3-0324采用MIT许可证,允许对应用程序进行免费修改,分发和商业化,从而进一步降低了开发人员的阈值。
连续的秘密战争
就像DeepSeek宣布V3型号已完成了一个小版本升级一样,3月25日,当地时间,Open人工智能研究中心(OpenAI)宣布启动4O映像生成功能,“将最先进的图像生成器集成到GPT-4O中。”从现在开始,All Plus,Pro,Team和Free用户将在Chatgpt和Sora接一个地体验此功能。企业版和教育版将很快连接,Sora平台将同时启用。开发人员将通过API调用GPT-4O图像生成功能,接下来的几周将打开接口权限。根据报道,GPT -4O图像生成功能可以准确地渲染文本,严格遵循命令提示,深刻称呼4O知识库和对话环境 - 包括上传图像的次要创建或将其转换为视觉灵感。
Google还发布了Gemini 2.5系列人工智能推断模型。在回答问题之前,这一系列的模型将暂时“思考”。作为该系列模型的第一个产品,Gemini 2.5 Pro实验已首次亮相。这种多模式推理人工智能模型被Google称为“目前最聪明的模型”。它支持高达100万个令牌的巨大背景窗口。它可以在一次内处理约750,000个英语单词,远远超过了《指环王》三部曲的总字数。
Google透露,将来,Gemini 2.5 Pro将支持200万个令牌的双输入长度。该模型将于周二的开发人员平台Google AI Studio提供,并将向每月支付20美元的用户开放以订阅“ Gemini Advanced”。 Google表示,将来所有新推出的AI模型都将整合推理功能。
值得注意的是,Gemini 2.5系列的第一个版本,Pro Experimens,一旦它首次亮相就抢到了大型赛场上的第一名,并且比GPT-4.5高40分! Google介绍的是,与Gemini 2.0 Flash Thinky相比,Google的第一个推理模型,Gemini 2.5在基本模型和训练后技术中都改进了。它不仅在大型模型竞技场中赢得了高分,而且Gemini 2.5 Pro在各种推理,数学,科学和编程基准测试中表现出色。这是与Claude 3.7十四行诗竞争的能力,数学可以与Grok 3相提并论。
人工智能的光环仍然存在
在DeepSeek的最新举动之后,Tencent也迅速采取了行动。在3月26日清晨,腾讯Yuanbao进行了重大升级,同时与两个主要模型相关:深思熟虑的模型“ Tencent Hunyuan T1”和DeepSeek V3-0324的最新版本。
机构认为,目前人工智能的光环支持中国资产可能仍然存在。高盛(Goldman Sachs)发表了最新的研究报告,该报告说,在中国的股票今年增加了约20%之后,预计将获得更多基本驱动的收益,但重申,由于事件风险和利润压力,牛市可能会放缓。
分析师Kinger Lau和其他人在报告中指出,基于对投资者的研究,股票投资者似乎对基于宏,政策和其他原因的美国关税担忧感到放松。原因可能是一些投资者认为,与贸易战1.0相比,目前中国目前似乎更有能力应对外部需求逆风,这是因为减少了对美国的直接出口以及提高产品竞争力的原因。
尽管有关人工智能潜在好处的问题和辩论已经浮出水面,但大多数投资者都同意中国人工智能叙事是改变游戏规则的人。预计在未来十年中,人工智能的广泛使用预计将每年将中国每股收益提高2.5%,并将潜在的投资组合资本流入超过2000亿美元。
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。