谷歌发布Veo 2.0:4K分辨率高质量视频生成工具,逼真动作与镜头控制
据谷歌官网介绍,Veo 2可以制作运动逼真、输出质量高的视频。其最高分辨率可达4K,时长可达2分钟以上。谷歌表示,Veo 代表了高质量视频生成的重大进步。
除了视频清晰度的提升,Veo 2 对物理世界的理解和镜头控制也令人惊叹:
这个场景的部分提示是:低角度跟踪拍摄,18mm镜头。汽车漂移,留下轻微的痕迹和轮胎烟雾。摄像机低速跟随,捕捉到这辆时尚的橄榄绿肌肉车接近拐角时的画面。
这一场景的部分提示是:特写镜头聚焦于一位女DJ的脸部,她美丽浓密的黑色卷发勾勒出她的五官。她闭上眼睛,沉浸在节奏中,嘴角挂着微笑。当她点头并随着节拍摇摆时,摄像机捕捉到了她头部的微妙动作。
从以上案例可以看出,Veo 2 在真实世界恢复和提示指令跟随方面都有良好的表现。在谷歌官网发布的性能评测中,Veo 2还击败了Sora Turbo、Keling、MiniMax等多款国内外AI Vincent视频模型。
对此,谷歌总结认为Veo 2的技术进步主要体现在三个方面。首先是物理引擎的优化,它决定了AI视频模型对现实世界物理规律的深入理解。二是摄影技术的融合,可以输出更丰富的视觉效果。最后,提高了角色的表现力,使角色的动作和表情更加真实。
目前,Veo 2 已被引入 Google 的视频创作工具 VedioFX。就在上周,OpenAI 正式推出了 Sora Turbo,向美国和其他市场的 ChatGPT 付费用户开放。新工具 Sora Turbo 可以生成长达 20 秒的视频,并可以提供这些视频的多种变体。
与此同时,国产文盛视频不断进步。今年以来,国内企业开始加速AI视频生成产品的研发和迭代,产品能力不断提升:
今年6月,快手AI团队发布了科灵AI视频生成大模型,可生成长达2分钟、分辨率为1080p的视频;
7月,智浦AI推出视频生成产品智浦清影,11月升级支持生成时长10秒的4K超高清视频;
8月,字节推出极萌AI一站式创作平台,随后于11月宣布极萌AI视频型号S2.0Pro和P2.0Pro上线。
山西证券12月12日研报指出,随着AI视频生成工具不断迭代,未来其向各类应用场景的渗透有望加速。一方面,应用层建议重点关注创意、设计、教育等多模态领域,尤其是与视频生成密切相关的领域;另一方面,视频生成模型对算力的要求明显高于文本,因此重点关注AI算力相关的目标。
发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。