谷歌Veo3视频生成模型问世，背景音效与对话生成能力惊艳亮相_科技资讯

创始人

2025-05-21 04:41:43

在今年的I/O开发者大会上，谷歌带来了一项令人瞩目的技术突破——新一代视频生成模型Veo3。这款模型不仅标志着谷歌在视频合成领域的重大进步，还因其能生成视频背景音效而备受瞩目。

据谷歌介绍，Veo3不仅能够合成逼真的画面，还能为各种场景，如鸟鸣、街头交通等，配上相应的音效。更令人惊叹的是，它甚至能生成人物对话，使得生成的视频内容更加生动和真实。这一技术的实现，无疑将极大地推动影视制作行业的发展。

除了音效生成外，Veo3在物理模拟与口型同步方面也展现出了卓越的性能。这意味着，生成的视频内容在视觉和听觉上都将更加贴近真实世界，难以被辨识为AI生成的作品。

然而，目前Veo3的开放范围还相对有限。谷歌表示，该模型目前仅面向美国地区的Gemini Ultra用户和Vertex AI的企业用户开放。同时，Veo3已经集成进了谷歌的AI影视制作工具Flow中，使得用户能够更加方便地使用这一先进技术。

对于已经在使用Flow的用户来说，Veo3的加入无疑将带来更加丰富的创作体验。用户可以通过Flow使用镜头控制功能，对生成的视频内容进行旋转、缩放等操作，甚至可以将画面从竖屏调整为横屏。用户还可以在视频中添加或删除元素，使得最终的作品更加符合自己的创作意图。

随着AI生成技术的不断发展，用户越来越难以辨别出哪些是AI生成的内容。为了应对这一问题，谷歌推出了SynthID Detector工具。用户可以通过上传媒体文件，检测其是否包含SynthID水印，从而判断该内容是否为AI生成。然而，需要注意的是，目前并非所有的图像生成模型都支持这一水印功能。

尽管Veo3的开放范围还相对有限，但谷歌I/O开发者大会仍在如火如荼地进行中。我们有理由相信，随着技术的不断进步和应用的不断拓展，Veo3将有望在未来为更多的用户带来更加便捷和高效的影视制作体验。