阿里云万相2.1模型开源：全球开发者可免费下载，支持文生视频和图生视频任务

来源：网络作者：日期：2025-02-26 10:06:10

K图 BABA_0

K图 09988_0

2月25日晚上，阿里巴巴云视觉生成基本模型Wanxian 2.1（WAN）是主要的开源！

据报道，该开源采用Apache2.0协议，并且14B和1.3B的两个参数规范的所有推理代码和权重是开源的，它们还支持Wensheng视频和Tusheng视频任务。全球开发人员可以使用GitHub，HuggingFace和Modai社区下载和经验。

昨夜阿里又有大动作阿里云视觉生成基座模型万相2.1重磅开源_昨夜阿里又有大动作阿里云视觉生成基座模型万相2.1重磅开源_

自2023年以来，阿里巴巴云一直坚持大型型号的开源路线。 QWEN导数模型的数量已超过100,000，使其成为世界上最大的AI模型家族之一。借助Wanxiang的开源，阿里巴巴云获得了全模式和全尺寸的开源。

昨夜阿里又有大动作阿里云视觉生成基座模型万相2.1重磅开源_昨夜阿里又有大动作阿里云视觉生成基座模型万相2.1重磅开源_

技术创新

消费者图形卡也可以运行

2023年7月，Tongyi Wanxian图像生成模块首次亮相。在2024年9月的2024年Yunqi会议上，阿里巴巴云首席执行官Zhou Jingren宣布了Tongyi Wanxiang的全面升级，并发布了一种新的视频生成模型，可以生成电影和电视高清视频，可用于电影和电视的创作，电影和电视的创作，电影和电视动画设计，广告设计等。在发布Wanxiang视频生成模型之后，Tongyi Big Model涵盖了所有模式场景，例如文本生成，图像理解，视频理解，音频理解，图像生成和视频生成。

2025年1月，Wanxiang宣布启动2.1版型号升级，该升级大大提高了视频生成和图像生成的功能。据报道，在视频生成方面，Wanxiang 2.1通过其自发开发的有效VAE和DIT体系结构增强了时空上下文建模功能，支持无限长的1080p视频的有效编码和解码，并意识到了中国文本视频第一次生成功能。

记者了解到，Wanxian模型的14B专业版在指挥合规，复杂运动，物理建模，文本视频生成等方面具有出色的表现。，Luma，Pika，总得分为86.22％，并且排名第一。

昨夜阿里又有大动作阿里云视觉生成基座模型万相2.1重磅开源_昨夜阿里又有大动作阿里云视觉生成基座模型万相2.1重磅开源_

1.3B速度版的测试结果不仅超过了较大的开源模型，而且还接近某些封闭源模型的结果。它也可以在消费者图形卡上运行。它仅需要8.2GB的视频记忆即可生成480p视频，该视频适用于二级模型开发和学术研究。

Wanxiang 2.1通过一系列技术创新在发电能力方面取得了重大进展。包括自我发展和有效的因果3D VAE，可扩展的预训练策略，大规模的数据链接构建和自动评估指标，这些创新共同提高了模型的最终性能。

Wanxiang团队的实验结果表明，在14个主要维度中，包括运动质量，视觉质量，样式和多目标测试，Wanxiang取得了行业领先的性能，并获得了5个首先。特别是在复杂运动和身体定律的表现中，Wanxian的性能可以稳定地显示出各种复杂的角色运动，例如旋转，跳跃，转弯，滚动等；它可以准确恢复复杂的真实物理，例如碰撞，反弹和切割。场景。

无限的可能性

2月24日，阿里巴巴集团首席执行官Wu Yongming宣布，在接下来的三年中，阿里巴巴将投资超过3800亿元人民币建设云和AI硬件基础设施，创造云领域中中国私人企业的历史。最大的投资记录。

Guotai Junan认为，阿里巴巴大大增加了对AI基础设施的投资，国内CSP（云服务提供商）制造商将积极跟进，并有望重新获得IDC（Internet Data Data Center）投资繁荣，该投资繁荣已出现在“ Internet +”中。循环。其他CSP制造商还将同时增加对AIDC（人工智能数据中心）的投资，以促进国内AI计算能力产业链的需求改善。

在该行业看来，阿里巴巴对数百十亿的投资不仅承诺遵循高质量发展的道路，而且还是坚持其主要业务，加强其行业，投资未来并投资的坚定声明在创新中。正如Wu Yongming所说：“ AI爆炸远远超出了期望，国内技术行业正在全面展开，并且具有巨大的潜力。阿里巴巴将不得付出任何努力来加速云和AI硬件基础设施的建设，并促进整个行业。”

上海证券新闻的一名记者发现，最近，阿里巴巴在AI中进行了持续的安排，涉及技术研究和开发，组织结构调整，人事招聘和其他方面，开放了“ Ren和Du Meridians”，以全面实施内部AI策略和数百亿美元。可以说大规模的基础设施投资是“决定然后搬家”的。

今年1月，阿里巴巴开设了新一代的多模式QWEN2.5-VL，并根据MOE架构启动了旗舰模型QWEN2.5-MAX。截至2025年1月31日，基于QWEN模型家族在拥抱面上开发的衍生模型数量已超过90,000，使其成为世界上最大的AI模型家族之一。

2月25日，Tongyi Qianwen的官方帐户QWEN在海外社交平台上发布了QWQ-MAX-PREVIEW（推理模型预览版），并将很快发布QWQ-MAX的官方版本，QWQ-MAX是可以在本地部署的较小版本，该版本可以在本地部署，并且是官方的。应用QWQ -MAX。

分类： 股市

地址： http://news.lianzhou.cn/post/9428.html