谷歌发布Veo 2.0：4K分辨率高质量视频生成工具，逼真动作与镜头控制

来源：网络作者：日期：2024-12-17 17:11:08

据谷歌官网介绍，Veo 2可以制作运动逼真、输出质量高的视频。其最高分辨率可达4K，时长可达2分钟以上。谷歌表示，Veo 代表了高质量视频生成的重大进步。

除了视频清晰度的提升，Veo 2 对物理世界的理解和镜头控制也令人惊叹：

谷歌AI视频模型深夜炸场：4K分辨率+2分钟时长又给OpenAI“来了一枪”__谷歌AI视频模型深夜炸场：4K分辨率+2分钟时长又给OpenAI“来了一枪”

这个场景的部分提示是：低角度跟踪拍摄，18mm镜头。汽车漂移，留下轻微的痕迹和轮胎烟雾。摄像机低速跟随，捕捉到这辆时尚的橄榄绿肌肉车接近拐角时的画面。

这一场景的部分提示是：特写镜头聚焦于一位女DJ的脸部，她美丽浓密的黑色卷发勾勒出她的五官。她闭上眼睛，沉浸在节奏中，嘴角挂着微笑。当她点头并随着节拍摇摆时，摄像机捕捉到了她头部的微妙动作。

从以上案例可以看出，Veo 2 在真实世界恢复和提示指令跟随方面都有良好的表现。在谷歌官网发布的性能评测中，Veo 2还击败了Sora Turbo、Keling、MiniMax等多款国内外AI Vincent视频模型。

对此，谷歌总结认为Veo 2的技术进步主要体现在三个方面。首先是物理引擎的优化，它决定了AI视频模型对现实世界物理规律的深入理解。二是摄影技术的融合，可以输出更丰富的视觉效果。最后，提高了角色的表现力，使角色的动作和表情更加真实。

目前，Veo 2 已被引入 Google 的视频创作工具 VedioFX。就在上周，OpenAI 正式推出了 Sora Turbo，向美国和其他市场的 ChatGPT 付费用户开放。新工具 Sora Turbo 可以生成长达 20 秒的视频，并可以提供这些视频的多种变体。

与此同时，国产文盛视频不断进步。今年以来，国内企业开始加速AI视频生成产品的研发和迭代，产品能力不断提升：

今年6月，快手AI团队发布了科灵AI视频生成大模型，可生成长达2分钟、分辨率为1080p的视频；

7月，智浦AI推出视频生成产品智浦清影，11月升级支持生成时长10秒的4K超高清视频；

8月，字节推出极萌AI一站式创作平台，随后于11月宣布极萌AI视频型号S2.0Pro和P2.0Pro上线。

山西证券12月12日研报指出，随着AI视频生成工具不断迭代，未来其向各类应用场景的渗透有望加速。一方面，应用层建议重点关注创意、设计、教育等多模态领域，尤其是与视频生成密切相关的领域；另一方面，视频生成模型对算力的要求明显高于文本，因此重点关注AI算力相关的目标。

分类： 股市

地址： http://news.lianzhou.cn/post/4855.html

责任编辑： admin

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。