腾讯混元Turbo S大模型秒回功能解析:快慢思考结合提升智能效率
腾讯说:“您的大型模型很快就可以发音并立即返回您,并且将加载到铸锭中。”关于为什么需要“第二次返回”功能的原因,腾讯解释说,研究表明,大约90%-95%的人类日常决策依赖于直觉。快速思考就像人类的“直觉”一样,在一般情况下,它为大型模型提供了快速响应能力,而缓慢的思维更像是理性的思维,通过分析逻辑提供了解决问题的想法。快速思考和缓慢思考的结合和补充可以使大型模型更加聪明,更有效地解决问题。
根据评估,在该行业常用的多个公共基准上,腾讯Hunyuan Turbo S在基准测试行业领先模型(例如DeepSeek-V3,GPT-4O,Claude 3.5)中证明了其有效性,例如知识,数学和推理。
在表中,其他模型的评估指标来自官方评估结果,官方评估结果不包括Hunyuan内部评估平台的一些。
接下来,Hunyuan Turbo的车型将逐渐在腾讯Yuanbao灰度上推出,并将很快得到充分覆盖。目前,开发人员和企业用户可以通过腾讯云上的API致电Tencent Hunyuan Turbo S,并在一周后的一周内免费试用它。
在价格方面,涡轮增压S的投入价格为0.8元/百万个令牌,输出价格为2元/百万个令牌,比上一代Hunyuan Turbo模型低几倍。
升级的三个主要方面
将来,它将成为Hunyuan系列衍生模型的核心基础
总而言之,涡轮模型具有三个主要升级。
首先,模型架构具有重要的技术创新。通过创新采用杂种 - 曼巴(Mamba-Mamba-Transformer Fusion)模型,Hunyuan Turbo有效地降低了传统变压器结构的计算复杂性,减少了KV-CACHE CACHE的使用情况,并降低了培训和推理成本。
根据Tencent的说法,新的Fusion模型突破了传统纯变压器结构大型模型所面临的高长期文章培训和推理成本的问题。一方面,它具有有效处理长序列的能力,并保留了变形金刚捕获复杂环境的能力的优势,并构建具有出色的视频记忆和计算效率的混合体系结构。这是该行业第一次成功地将Mamba架构应用于超大的Moe模型而不会损失。
其次,该模型的总体效果得到了改善。通过长期和短暂思维链的整合,Tencent Hunyuan Turbo S显着提高了其科学推理能力,同时保持了文科问题方面的快速思维经验,并且总体效果得到了显着改善。
第三,部署成本已大大下降。它有效地降低了传统变压器结构的计算复杂性,减少了KV-CACHE CACHE使用情况,并降低了培训和推理成本。
Tencent Hunyuan透露,作为旗舰模型,Turbo S将来将成为腾讯系列衍生品模型的核心基础,为推理,长文章和代码等衍生模型提供了基本功能。
值得一提的是,基于Turbo S,Tencent通过引入诸如长时间思考链,搜索增强和强化学习之类的技术来开发自己的推理模型T1。该模型是在Tencent Yuanbao推出的。用户可以选择DeepSeek-R1或Tencent Hunyuan T1模型来回答。
Tencent Hunyuan还表示,Tencent Hunyuan T1 Model API的官方版本也将很快推出,并为外界提供访问服务。
争取AI模型的战斗变得越来越激烈
互联网制造商继续增加对AI的投资
Tencent这次推出Hunyuan Turbo S模型的背后是中国互联网行业AI领域越来越激烈的竞争。
不久前,腾讯的第一个AI本机应用程序Yuanbao超过了Doubao,并在中国Apple Free App下载排名中排名第二。 DeepSeek继续排名第一。
自2025年以来,国内AI大型模型通过算法和工程创新加速了技术飞跃,低成本DeepSeek-R1推理能力与OpenAI O1相当。阿里巴巴发布了1000亿个Moe Architecture Model Qwen2.5-Max; Doubao依靠BONTEDANCE的生态优势来提高模型能力。腾讯的大型模型已被深入融合到微信和其他业务场景中。
阿里巴巴说,在接下来的三年中,它将重点关注AI策略的核心,并增加三个主要领域的投资:AI和云计算的基础设施构建,AI基本模型平台,AI本机应用以及AI的AI转换和现有业务的升级,并宣布该集团在云和AI中的基础设施投资在下三个年内被预期超过了。
同时,竞争格局也在发生变化。高盛(Goldman Sachs)发布的报告指出,随着人工智能技术的快速发展以及应用程序方案的不断扩展,中国互联网行业的竞争格局逐渐区分为两个主要营地:AI基础设施和AI应用程序。
高盛(Goldman Sachs)认为,阿里巴巴(Alibaba)已成为其强大的云服务基础架构的AI基础架构的关键参与者。虽然Tencent已成为AI应用程序领域的核心受益者,其生态系统和CEND应用程序中的用户体验很强。
通过其强大的C-End生态系统和用户体验,Tencent将AI技术深入到日常生活中。 Yuanbao的快速崛起反映了Tencent在AI应用领域的强大强度。
该报告指出,Yuanbao整合了DeepSeek-R1模型的强大推理功能和Tencent Cloud的AI推理基础架构。这种组合不仅为用户提供了更智能的交互式体验,而且还通过微信生态系统的独特内容支持来实现更准确的信息推动和更有效的任务执行。
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。