阿里云万相2.1模型开源:全球开发者可免费下载,支持文生视频和图生视频任务
2月25日晚上,阿里巴巴云视觉生成基本模型Wanxian 2.1(WAN)是主要的开源!
据报道,该开源采用Apache2.0协议,并且14B和1.3B的两个参数规范的所有推理代码和权重是开源的,它们还支持Wensheng视频和Tusheng视频任务。全球开发人员可以使用GitHub,HuggingFace和Modai社区下载和经验。
自2023年以来,阿里巴巴云一直坚持大型型号的开源路线。 QWEN导数模型的数量已超过100,000,使其成为世界上最大的AI模型家族之一。借助Wanxiang的开源,阿里巴巴云获得了全模式和全尺寸的开源。
技术创新
消费者图形卡也可以运行
2023年7月,Tongyi Wanxian图像生成模块首次亮相。在2024年9月的2024年Yunqi会议上,阿里巴巴云首席执行官Zhou Jingren宣布了Tongyi Wanxiang的全面升级,并发布了一种新的视频生成模型,可以生成电影和电视高清视频,可用于电影和电视的创作,电影和电视的创作,电影和电视动画设计,广告设计等。在发布Wanxiang视频生成模型之后,Tongyi Big Model涵盖了所有模式场景,例如文本生成,图像理解,视频理解,音频理解,图像生成和视频生成。
2025年1月,Wanxiang宣布启动2.1版型号升级,该升级大大提高了视频生成和图像生成的功能。据报道,在视频生成方面,Wanxiang 2.1通过其自发开发的有效VAE和DIT体系结构增强了时空上下文建模功能,支持无限长的1080p视频的有效编码和解码,并意识到了中国文本视频第一次生成功能。
记者了解到,Wanxian模型的14B专业版在指挥合规,复杂运动,物理建模,文本视频生成等方面具有出色的表现。 ,Luma,Pika,总得分为86.22%,并且排名第一。
1.3B速度版的测试结果不仅超过了较大的开源模型,而且还接近某些封闭源模型的结果。它也可以在消费者图形卡上运行。它仅需要8.2GB的视频记忆即可生成480p视频,该视频适用于二级模型开发和学术研究。
Wanxiang 2.1通过一系列技术创新在发电能力方面取得了重大进展。包括自我发展和有效的因果3D VAE,可扩展的预训练策略,大规模的数据链接构建和自动评估指标,这些创新共同提高了模型的最终性能。
Wanxiang团队的实验结果表明,在14个主要维度中,包括运动质量,视觉质量,样式和多目标测试,Wanxiang取得了行业领先的性能,并获得了5个首先。特别是在复杂运动和身体定律的表现中,Wanxian的性能可以稳定地显示出各种复杂的角色运动,例如旋转,跳跃,转弯,滚动等;它可以准确恢复复杂的真实物理,例如碰撞,反弹和切割。场景。
无限的可能性
2月24日,阿里巴巴集团首席执行官Wu Yongming宣布,在接下来的三年中,阿里巴巴将投资超过3800亿元人民币建设云和AI硬件基础设施,创造云领域中中国私人企业的历史。最大的投资记录。
Guotai Junan认为,阿里巴巴大大增加了对AI基础设施的投资,国内CSP(云服务提供商)制造商将积极跟进,并有望重新获得IDC(Internet Data Data Center)投资繁荣,该投资繁荣已出现在“ Internet +”中。循环。其他CSP制造商还将同时增加对AIDC(人工智能数据中心)的投资,以促进国内AI计算能力产业链的需求改善。
在该行业看来,阿里巴巴对数百十亿的投资不仅承诺遵循高质量发展的道路,而且还是坚持其主要业务,加强其行业,投资未来并投资的坚定声明在创新中。正如Wu Yongming所说:“ AI爆炸远远超出了期望,国内技术行业正在全面展开,并且具有巨大的潜力。阿里巴巴将不得付出任何努力来加速云和AI硬件基础设施的建设,并促进整个行业。”
上海证券新闻的一名记者发现,最近,阿里巴巴在AI中进行了持续的安排,涉及技术研究和开发,组织结构调整,人事招聘和其他方面,开放了“ Ren和Du Meridians”,以全面实施内部AI策略和数百亿美元。可以说大规模的基础设施投资是“决定然后搬家”的。
今年1月,阿里巴巴开设了新一代的多模式QWEN2.5-VL,并根据MOE架构启动了旗舰模型QWEN2.5-MAX。截至2025年1月31日,基于QWEN模型家族在拥抱面上开发的衍生模型数量已超过90,000,使其成为世界上最大的AI模型家族之一。
2月25日,Tongyi Qianwen的官方帐户QWEN在海外社交平台上发布了QWQ-MAX-PREVIEW(推理模型预览版),并将很快发布QWQ-MAX的官方版本,QWQ-MAX是可以在本地部署的较小版本,该版本可以在本地部署,并且是官方的。应用QWQ -MAX。
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。