百度提前免费发布文心大模型4.5及X1,提升多模态理解与深度思考能力
3月16日,百度宣布正式发布Wenxin Mockup 4.5和Wenxin Mockup X1。这两个大型型号可以在Wenxin Yiyan的官方网站上免费使用。
以前,百度宣布Wen Xin Yiyan将于4月1日免费。在发布两种最新型号的同时,Baidu将促进空闲时间以充分改善用户体验。
更强的能力和更低的价格
具体而言,其中Wenxin Big Model 4.5是百度的第一个本机多模型。它的多模式理解,文本和逻辑推理能力已得到显着提高。它不仅具有图形推理和图表分析的“高智商”,而且还具有理解模因,漫画,歌曲,电影和其他多模式内容的“高情绪智力”,并且具有理解模因,漫画,歌曲,电影,电影和其他多模式内容的“高情绪智力”,并且在许多测试中都表现更好。
Wenxin Big X1是一个深思熟虑的模型。它不仅在性能方面基准了DeepSeek-R1,而且具有“漫长的思维链”。它擅长中文知识问题和答案,文学创作,逻辑推理等,还增加了多模式功能和多工具呼叫,这些功能可以理解和生成图片,并且还可以调用工具来生成代码,图表和其他丰富内容。
Wenxin Big Model X1使用关键技术,例如渐进式增强学习,基于思维链和动作链的端到端培训以及多样化和统一的奖励系统。通过对PaddlePaddle和Wenxin的联合优化,它通过压缩,推理和服务部署来实现完整链接的极端优化,从而大大降低了推理成本。
目前,这两种模型均已在Wenxin Yiyan的官方网站上启动,用户可以通过登录免费体验它。与此同时,企业和开发人员可以在BAIDU Smart Cloud Cloud Qianfan Big Model Platform上调用新型号。 Wenxin Big 4.5同时推出,投入价格为0.004元/公斤代币,产出价格为0.016元/公斤代币,约为GPT4.5的价格的1%; Wenxin Big X1仅是DeepSeek-R1的一半,其价格是进入0.002元/公斤代币,输出为0.008元/公斤代币,并将很快在Qianfan平台上推出。
行业巨头正在加速
自今年年初以来,DeepSeek的提升,行业巨头加速了AI Big Model领域的业务发展。
3月12日,Google首席执行官宣布了最新的开源多模式模型Gemma3。Gemma3有四个参数:10亿,40亿,120亿和270亿。即使是最小的10亿参数模型也具有强大的多模式处理功能。
在LMARENA竞技场,Gemma 3的表现良好。其中,具有27b参数的Gemma 3击败了O1-Preview,O3-Mini High和DeepSeek V3,这仅次于DeepSeek-R1。
同时,Google还推出了基于Gemini 2.0:Gemini Robotics和Gemini Robotics-ER的两个新的人工智能模型,旨在开发更灵活和互动的机器人,这些机器人有望在更多场景中促进机器人的应用和普及。
3月12日,OpenAI推出了一套专门开发的新工具包,以简化AI代理应用程序,包括新的响应API,其第一个开源代理SDK,各种内置工具和可观察性工具。其中,Adents SDK的特殊功能之一是支持多个代理之间的动态任务协作,并可以开发超复杂的智能自动化业务流程,例如MANUS。
最新消息还表明,在去年成功部署了第一个用于推理任务的处理器后,Meta与TSMC合作测试其第一个独立开发的AI培训芯片。据报道,元将在2025年将650亿美元投资于AI基础设施建设。
就百度而言,除了发布的两个最新大型型号外,Wenxin型号将于6月30日正式开放,Wenxin Model 5.0将于今年下半年发布。
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。