阿里通义千问推出QwQ-32B推理模型，320亿参数性能媲美DeepSeek-R1，降低部署成本

来源：网络作者：日期：2025-03-06 19:33:47

K图 09988_0

K图 BABA_0

3月6日，阿里巴巴·汤蒂·昆温（Alibaba Tongyi Qianwen）的大型模特团队宣布已正式推出了最新的推断型QWQ-32B。

阿里巴巴说，这是一个具有320亿个参数的型号，其性能可与DeepSeek-R1相当，具有6710亿个参数（其中370亿个参数），但两个参数量的差异几乎差不多20倍。

据报道，通过大规模的增强学习，Qianwen QWQ-32B取得了数学，代码和一般能力的质量飞跃，其整体性能与DeepSeek-R1相当。同时，它大大降低了部署成本，还可以在消费级图形卡上实现本地部署。

在一系列数学推理，编程能力和一般能力的基准测试中，Tongyi Qianwen Big Model Team将QWQ-32B与O1-Mini和DeepSeek全血型版本和OpenAI的DiveSeek全血版本进行了比较。结果表明，在AIME24评估集中测试了评估代码能力的数学能力和livecodebench，QWQ-32B的性能与DeepSeek-R1相当，远胜于O1-MINI和相同大小的R1蒸馏模型。

CFF20LXzkOxwGL5JKGcELqpg91OLvrcTpIOTZs8GBY25Gqd79wwC9sc1o4GJN2RH6ZNic9Po3ygXXk6P5tJ5XOA.jpg

据报道，基于寒冷的开始，阿里巴巴·汤伊（Alibaba Tongyi）团队进行了两轮大规模的加强学习，以实现数学和编程任务和一般能力。在最初的阶段，强化学习培训是专门针对数学和编程任务进行的。与依靠传统奖励模型不同，Tongyi Qianwen Big Model团队通过验证生成的答案的正确性来提供有关数学问题的反馈，并评估生成的代码是否通过代码执行服务器通过测试案例成功地提供了代码的反馈。

行业内部人士分析了QWQ-32B的成功表明，将强大的基本模型与大规模强化学习结合在一起可以在较小的参数量表上实现出色的性能，这为将来提供了通用人工智能的可行途径。

阿里阿里巴巴股价__阿里巴巴股票涨

值得注意的是，尽管DeepSeek-R1的参数量为6710亿个，因为DeepSeek的创新使用MOE（混合专家模型）架构和MLA（降落潜在的注意机制）方法，只有370亿个参数被激活，每个推断占总数的5.5％）。这使得deepSeek-r1的整体大量大，但是在工作时只需要使用其一小部分力量，这可以节省资源并有效地完成任务。

阿里巴巴·汤蒂（Alibaba Tongyi）团队表示，将来，它将继续探索代理商和强化学习的整合以实现长期推理，探索更高的智力并最终实现AGI的目标。

目前，阿里巴巴采用了松散的Apache2.0协议，向世界开源了QWQ-32B模型。每个人都可以免费下载并使用它，并且可以直接通过阿里巴巴云bailian平台调用模型API服务。同时，用户还可以通过Tongyi App免费体验最新的QWQ-32B型号。

在3月6日的早期交易中，阿里巴巴集团（09988.hk）香港股票急剧开放，增长了6％以上，截至结束时，股票增长了8％以上。

3月5日晚上，阿里巴巴的美国股票上涨了8％以上。

此前，2月25日，阿里巴巴·汤伊（Alibaba Tongyi Qwen）发布了推理模型QWQ-max-preview的预览版本，构建了旗舰模型QWEN2.5-MAX，该模型支持网络搜索，并将显示诸如DeepSeek和Kimi的推理模型之类的思维过程。

Changjiang Securities的一份研究报告指出，最近，阿里巴巴继续在AI领域努力，并实施了AI驱动的战略。随着随后投资的逐步增加，相关的成就有望加速迭代，相关成就可能会使相关的工业连锁店受益，加速AI应用程序的实施，并进一步推动计算电源需求的爆炸。同时，由于阿里巴巴增加了三个方面的投资：AI基础设施，基本模型平台，AI本机应用程序和现有业务的AI转换，它可能会导致中国AI行业的加速发展。

分类： 股市

地址： http://news.lianzhou.cn/post/10097.html