4月15日快手可灵AI全球发布2.0模型,多模态视频编辑功能应对用户AI创意表达难题
随着AI生成的视频变得越来越流行,如何将用户的想法准确转换为AI视频已成为一个困难的问题。用户经常发现很难通过仅依靠文本来描述他们的需求。
4月15日,Kuaishou的Keling AI宣布将向世界发布Keling 2.0视频生成模型和Keling 2.0图像生成模型。 Kuaishou高级副总裁兼Kuaishou社区科学系列负责人Gai Kun告诉该论文的记者:“ AI在协助创造性表达方面具有很大的潜力,但是当前的行业发展状况仍然远离满足用户需求。在AI生成内容的稳定性和确切的用户复杂创造力的稳定性方面仍然存在许多挑战。”
In this iteration of version 2.0, the most popular feature of multimodal video editing is the new function of multimodal video editing: Keling AI uses the new interactive concept Multi-modal Visual Language (MVL), which allows users to efficiently convey the multi-dimensional creativity in their minds including identity, appearance, style, scene, action, expression, and mirror movement to AI based on multi-modal information such as image references and video clips.同时,用户可以直接使用自己的想法来表图像和其他形式作为输入,以生成与他们想法相匹配的创意视频。
根据Gai Kun的说法,MVL由TXT(纯文本,语义骨骼)和MMW(单词多模式文档)组成,它们可以准确地从视频生成和精细控制的两个基本方向的两个级别中实现AI创建者的创造性表达。他说,MMW(多模式描述符)不仅限于图片和视频,而且还会介绍其他模式的信息,例如声音,运动轨迹等,以便用户可以实现更丰富的表达方式。
数据显示,自去年6月发布以来,Keling AI总共完成了20多次迭代。来自世界各地的15,000多名开发人员和企业客户将Keling API应用于不同的行业方案。自去年6月推出以来的10个月中,Keling AI的每月活跃用户数量增加了25倍。截至目前,全球用户群已经超过2200万。
根据Gai Kun的说法,两种模型Keling和Ketu在团队内的多次输球率评估中排名第一。例如,在Wensheng视频领域,Keling 2.0 vs. Google VEO2的获胜/损失率为205%,而SORA的获胜/损失率为367%。
值得注意的是,当前的图片研究视频约占Keling AI视频创建的85%,并且图片的质量在视频的发电效果中也起着重要作用。
Kuaishou副总裁兼Keling AI负责人Zhang Di表示,Ketu 2.0的文学和传记图形功能也迎来了全面的升级。在程式化的响应方面,Ketu 2.0可以支持60多个程式化的效果转移,模型图的创造力和想象力已经取得了显着的飞跃。
同时,也可以在图2.0中启动图像可控的编辑功能:部分重绘和扩展,支持图片的添加,修改和修复。在多模式可控的图像中,图2.0的样式传输功能还启动了样式传输功能。您只需要上传图片并添加样式描述即可一点击切换图片的艺术风格,同时准确地保留原始图片的语义内容。
除了C-End订户外,Keling AI还向B-End商人提供API访问和其他服务。目前,Keling AI已经与包括小米,亚马逊云技术,阿里巴巴云,Freepik,Blue Cursor等的数千名国内和外国企业客户建立了合作关系。
在收入数据方面,Kuaishou的2024年第三季度财务报告数据表明,Keling AI在2024年9月的每月活跃用户达到了150万人的每月活跃用户;每月的商业化周转额也超过了1000万元人民币。根据Kuaishou于2024年的第四季度和全年财务报告,自Keling AI开始商业货币化至2025年2月以来,Keling AI的累计营业收入已超过1亿元人民币。
AI视频是一条集体关注互联网公司的曲目。去年12月,Tencent Hunyuan Big Model发布了AI视频生成Big Model,并宣布开源,参数量为130亿,这是当时最大的视频开源模型。国内主要的制造商和领先的初创公司,例如Bondedance,Minimax和Zhipu AI也推出了相应的产品。
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。