给你 30s,介绍一下今天你的 OOTD 吧。
一向温文尔雅、只穿基本款的苹果 CEO Tim Cook,在他的「个人 ID 视频」里,穿上了大号羽绒服,戴着镶钻牙套,对着镜头作出了最狠的 Gangsta 匪帮姿势。
最神来之笔的是,他像掏枪一样掏出了一个……德州仪器计算器。
▲视频来源:https://x.com/ReflctWillie/status/1997819640874205685
很多人看到这个视频都欲罢不能,一镜到底的展示也太过瘾了,一遍遍根本停不下来。视频作者把好莱坞大片级别的运镜语言,套用在一个荒诞的内容上。形式的高级感和内容的滑稽感,让这个 AI 视频没有那些普遍存在的廉价特点,很快在社交媒体上火起来。
立马就又有了马斯克的版本。
▲ 视频来源:https://x.com/VibeMarketer_/status/1999227084250448083
作者很细心的给出了完整的制作流程,通过使用底片印样方式的提示词(Contact Sheet Prompting),来获取到一套 6 张图片,背景一致、人物表情和服装一致,但是动作不同的照片组合。
▲ 3×2 的胶片印样
所谓印样,是最早在胶片时代,摄影里使用的一种缩略图版的照片索引页;现在把这样的概念用在 Nano Banana Pro 里,就是充分利用它的一致性能力,一次性生成一系列风格不同、角度不同的视频截图,然后再通过首尾帧来生成视频。
Nano Banana Pro 最多能一次性生成,包含 9 个以上关键帧的完整印样,每一帧图片都保持了出色的角色、细节和叙事一致性。即便是分别生成,Nano Banana Pro 也能根据上传的参考图片,自动填补图片内容,确保叙事一致性。
▲ 首尾帧视频生成,提示词:一镜到底的拍摄,摄像机平稳且缓慢地推进,聚焦在人物的眼镜上,同时始终将主体保持在画面中。主体的动作极小且谨慎。
有了图片之后,我们就可以通过首尾帧转视频的方式,将这几张图片整合起来,可灵、Veo 3.1、Hailuo、剪映等视频生成模型和工具,都可以轻松做到。
值得注意的是,像 Sora 2 目前是不支持上传这种有真实人脸的图片,马斯克的 Grok Imagine 也仅支持首帧转视频,综合下来,我们还是推荐使用 Google Veo 3.1、剪映里的即梦、还有快手可灵来完成。
▲Grok 图片转视频,默认生成的内容,不明所以
在这位视频博主给出的指南里,他使用了 Nano Banana Pro 和可灵来完成,并且它开发了一整套工具,让我们可以自由地实现各种人物的替换。
▲ 视频来源:https://x.com/ReflctWillie/status/1998720751806066916
根据他分享的工作流,由于这个视频和库克那个基本类似,所以它只需要修改输入的三张图片,以及做一些细微的调整。例如从口袋里掏出来的是 GAME BOY 游戏机,还有更符合这个人物特点的元素,库克是镶嵌着苹果股票代码 AAPL 的大金牙,美联储的主席鲍威尔则是戴上了 FED 的金戒指。
▲项目地址:https://github.com/shrimbly/node-banana
目前他把这个项目放在了知名开源平台 GitHub 上,如果你喜欢自己折腾的话,把项目下载到本地,输入自己的 Gemini API,也可以直接套用这个流程。
我们也尝试了这个自动化的项目,生成了几张图片,相比较在 Gemini 网页或 App 内生成,确实能方便不少。我们不需要反复的上传图片,而是可以直接选择需要使用的图片,直接修改提示词,将整个操作流水线化。
不过,没有 API 也没关系,下面跟着我们的详细步骤,就用 Gemini 网页版一样能做到。
找一张自己的照片,喜欢的潮牌衣服,还有酷炫的眼睛。我们这里用才情高绝、生性孤傲、多愁善感的林妹妹来举例,看看她的 OOTD 时尚大片会是怎么样。
这里我们直接用 Nano Banana Pro 生成了一张林黛玉的照片。
▲提示词:Subject: A hyper-realistic high-fashion portrait of Lin Daiyu from Dream of the Red Chamber. She has a fragile, melancholic beauty, pale skin, and her signature “knitted eyebrows” (frowning slightly). She looks distinctively sorrowful and intellectual. Attire: Wearing exquisite, high
下一篇:AI御三家年终“火拼”