阿里开源全能视频模型!生成编辑都精通,1.3B版本消费级显卡可跑
创始人
2025-05-15 16:20:52
0

一水 发自 凹非寺

量子位 | 公众号 QbitAI

业界功能最全、消费级显卡可跑、而且还是开源的?!

不卖关子了,这就是阿里最新开源的通义万相Wan2.1-VACE,号称当前业界功能最全的视频生成与编辑模型

有多全呢?来看官方介绍海报:

按照万相产品负责人的说法,“所有你能想到的关于视频生成的玩法,几乎都在这里了”。

而且与以往不同,以上功能主打“All in one”,都能在一个模型里体验。

目前Wan2.1-VACE一共有两个版本:

  • 1.3B版本:消费级显卡可跑,支持480p分辨率;

  • 14B版本:满血版,支持480p、720p分辨率。

模型已在GitHub、Hugging Face和魔搭社区上线,动手能力强的小伙伴现在可自行本地化部署,至于其他想在产品端直接体验的朋友,可能还要等一两天。

OK,话不多说,我们直接看新模型究竟有哪些玩法。

视频生成领域的“全能选手”

经过一番梳理,Wan2.1-VACE的“进阶攻略”如下:

  • 初阶玩法:基础的文生视频、图生视频(含首尾帧)、视频生视频等;

  • 中阶玩法:加入编辑功能,局部抹除或替换、视频重绘、时长或背景延展等;

  • 高阶玩法:将各种能力花式组合。

下面我们依次挑其中的一些亮点来看。

首先,在初级阶段,Wan2.1-VACE根据参考图生成融合视频的能力看起来相当丝滑。

比如分别上传两张娃娃和小蛇的图片:

生成的视频如下,不仅还原了文字所描述的氛围感,而且娃娃和小蛇的动作姿态都比较自然,整体构图和谐。

提示词:在一个欢乐而充满节日气氛的场景中,穿着鲜艳红色春服的小女孩正与她的可爱卡通蛇嬉戏。她的春服上绣着金色吉祥图案,散发着喜庆的气息,脸上洋溢着灿烂的笑容。蛇身呈现出亮眼的绿色,形状圆润,宽大的眼睛让它显得既友善又幽默。小女孩欢快地用手轻轻抚摸着蛇的头部,共同享受着这温馨的时刻。周围五彩斑斓的灯笼和彩带装饰着环境,阳光透过洒在她们身上,营造出一个充满友爱与幸福的新年氛围。

当然也有官方demo中效果更惊艳的(游戏中的角色直接照进现实)

除了融合能力,Wan2.1-VACE更值得说道的还是编辑功能。

要知道目前绝大多数视频生成AI都无法“一次就100%成功”,所以编辑功能几乎已成为刚需。

比如在产品宣传中,咱们直接来个“无中生有”。

第一步,直接使用文生视频创造出下列场景。

提示词:纪实摄影风格,房产自媒体博主站在一间现代化的客厅中央。博主穿着简洁时尚的衣物,面带微笑,两只手举在身前,手上空无一物正对着镜头介绍房屋情况。背景是一间宽敞明亮的客厅,家具简约现代,落地窗外是绿意盎然的花园。房间内光线充足,温馨舒适。中景全身人像,平视视角,轻微的运动感,如手指轻点屏幕。

第二步,给产品绘制一块想要放置的区域。

最后一步,“凭空捏造”后的效果be like:

同时,Wan2.1-VAC也支持视频重绘,包括姿态迁移、运动控制、结构控制、重新着色等。

比如给一段球体落入水中的姿势视频:

整个过程就能完整迁移到真实物体和环境中:

此外,Wan2.1-VACE还支持对原视频进行画面扩展时长扩展

最终,如果将以上所有基础功能组合起来,我们就能用来花式整活了(doge)。

比如将竖图变成横图的同时,让蒙娜丽莎戴上可爱眼镜:

又或者给视频“一键换脸”:

更多网友实测

鉴于以上官方demo所展示的效果确实令人惊艳,更多网友也迫不及待地开启了实测。

这里要补充一下,如果要进行本地部署,官方测试的模型在不同GPU上的计算效率如下:

OK,回到正题。

有网友尝试改变视频画幅比例(左边为原视频),结果其画面补充能力获得了认可。

还有人尝试给一张参考图和视频,以实现人物姿势、面部表情迁移,结果其细节控制能力也收获了好评。

同样获得认可的还有其融合能力,看起来也和demo一样自然。

那么最后问题来了,其实际能力究竟如何呢?

相关内容

热门资讯

新研究揭示提升癌症免疫疗法有效... 新华社耶路撒冷5月14日电(记者 王卓伦 陈君清)以色列理工学院近日发布公报说,该院研究人员发现一种...
高通骁龙7系新芯片发布:中端手... 日前,高通通过线上会议揭晓了第四代骁龙7移动平台。在这场技术解析会上,两位产品负责人向媒体展示了这款...
军事仿真重大突破!西安工业大学... 近日,西安工业大学计算机科学与工程学院傅妍芳教授团队,近期通过AI实现军事仿真想定的自动生成。传统指...
DeepSeek-V3再发论文... 机器之心报道 机器之心编辑部 关于 DeepSeek-V3,你需要了解的一切。 虽然此前 De...
5G技术赋能工业互联网实现新突... 随着全球制造业向智能化、柔性化方向加速演进,5G技术与工业互联网的深度融合正成为推动产业变革的核心引...
我国自主研发深水海管铺设智能监...   记者5月15日从海洋石油工程股份有限公司获悉,公司自主研发的深水海管铺设智能监测装备“海卫”系统...
新华鲜报|中央明确城市更新“路... 新华社北京5月15日电 题:中央明确城市更新“路线图”!宜居、韧性、智慧 新华社记者王优玲 城市,是...
世界上有隐身术吗?在太空中流泪... 无所不知的机器人小Y来啦!这次它为大家带来了4条有趣的冷知识,快快搬好小板凳围观吧! 图源:ge...
泰力基业取得集成一体化塑壳断路... 金融界2025年5月15日消息,国家知识产权局信息显示,泰力基业股份有限公司取得一项名为“一种集成一...
中国首个太空计算星座进入组网阶... 据新华社酒泉5月14日电(李国利、王晨宇)5月14日12时12分,中国在酒泉卫星发射中心使用长征二号...
美国首次成功试飞旋转爆震火箭发... 感谢IT之家网友 的线索投递! 5 月 15 日消息,美国推进技术公司 Venus Aerospa...
数字化转型重塑教学流程与场景 中国地质大学(武汉)地质学专业的同学手机登录“智学地大”,通过课程知识图谱的知识点,认真观察AI系统...
【特稿】带爪的脚印化石改写进化... 带爪的脚印化石改写进化史 爬行动物出现时间或大幅提前 袁原 多国研究人员发现,澳大利亚东南部出土的一...
共建医学人工智能高地,上海卫健... 5月15日上午,“人工智能+医疗健康”推进会在上海市徐汇区模速空间举行。 活动中,上海市卫生健康委与...
联想携手ISV“行业私厨”,让... 如今,已经没有一家企业不在未来蓝图中考虑AI、引入智能体。智能体工作站与智能体一体机,这个全新的端侧...
安卓最强性价比!3nm旗舰芯+... 朋友们!如果你还在犹豫618该入手哪款旗舰手机,不妨瞄准一下这匹性价比黑马——真我GT7。 废话不...
“中国孩子们友好自信、生机勃勃... “中国孩子们友好自信、生机勃勃” 湖北日报全媒记者 海冰 5月14日,武汉经济开发区神龙小学(湖...
Apple准备推出让Visio... 编译/VR陀螺 据彭博社 Mark Gurman 最新报道,苹果正在测试一项功能,该功能将允许用户利...
华为官宣,5月19日!鸿蒙电脑... 据媒体报道,在5月19日nova 14系列及鸿蒙电脑新品发布会上,华为将推出鸿蒙折叠电脑。 今日,华...
中国航空工业集团直升机所首款大... 为加速推进“人工智能+”专项行动,主动拥抱人工智能时代,中国航空工业集团直升机所在所内部署DeepS...