蒙娜丽莎自己戴上了时尚墨镜,阿里开源全能视频大模型
创始人
2025-05-15 12:17:19
0

5月14日晚,阿里巴巴正式开源通义万相Wan2.1-VACE,这是业界功能领先的视频生成与编辑模型,单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力。本次共开源1.3B和14B两个版本,其中1.3B版本可在消费级显卡运行,开发者可在GitHub、Huggingface及魔搭社区下载体验。该模型还将逐步在通义万相官网和阿里云百炼上线。

Wan2.1-VACE模型(采访对象供图)

据介绍,Wan2.1-VACE基于通义万相文生视频模型研发,同时创新性提出了全新的视频条件单元 VCU,它在输入形态上统一了文生视频、参考图生视频、视频生视频,基于局部区域的视频生视频4大类视频生成和编辑任务;同时,Wan2.1-VACE还进一步解决了多模态输入的token序列化难题,将VCU输入的帧序列进行概念解耦,分开重构成可变序列和不可变序列后进行编码。

Wan2.1-VACE支持全部主流输入形式,涵盖文本、图像、视频、Mask和控制信号,可以实现角色一致性、布局、运动姿态和幅度等要素的控制。例如,Wan2.1-VACE可以基于物体参考图或者视频帧生成一段视频,也可以通过抹除、局部扩展等操作,对原有视频进行重新生成,该模型还可以通过深度图、光流、布局、灰度、线稿等控制信号对视频进行编辑。

Wan2.1-VACE可以基于物体参考图或者视频帧生成一段视频(采访对象供图)

Wan2.1-VACE还支持任意基础能力的自由组合,用户无需针对特定功能训练一个新的专家模型,即可完成更复杂的任务,极大地扩展了AI视频生成的想象空间。例如,将图片参考和主体重塑功能组合,可以实现视频的物体替换;将图片参考、首帧参考、背景扩展和时长延展功能,可以将一张竖版图片变成横版视频,并且在其中加入参考图片中的元素。

Wan2.1-VACE可以基于物体参考图或者视频帧生成一段视频(采访对象供图)

自今年2月以来,通义万相已先后开源文生视频模型、图生视频模型和首尾帧生视频模型,目前在开源社区的下载量已超330万,在GitHub上斩获超1.1w star,是同期最受欢迎的视频生成模型。

(记者 张云山)

相关内容

热门资讯

百科常识1000题,扩展知识边... 在信息爆炸的时代,掌握百科常识不仅是个人素养的体现,也是日常生活和工作中不可或缺的技能,本文将带你深...
报了手动挡可以改自动挡吗 报了... 如果在报考驾照时选择了手动挡,但实际上想学习自动挡,那么只要尚未获得机动车驾驶证,就可以更改选择。这...
发动机沙沙响怎么回事 鍙戝姩鏈... 发动机沙沙响可能有以下六个原因,我们来一一解决。 1、机油不足。当汽车停放一段时间后,机油会流回油底...
保时捷macan怎么启动 保时... 保时捷Macan的启动方法保时捷Macan的启动方法十分简单,只需按照以下步骤操作即可:首先,将钥匙...
新车跑多少公里用燃油添加剂 新... 新车跑多少公里用燃油添加剂 正确的方法是首选汽车品牌原厂提供的燃油添加剂,并按照汽车保养手册的...
汽车定位器如何拆除 汽车定位器... 如何拆除汽车定位器 汽车定位器,又称汽车位置跟踪器,是一种车载防盗GPS定位产品。拆除汽车定位...
车辆水温低怎么办 车辆水温低怎... 如果您的车辆水温过低,您应该先确认是实际水温低,还是水温表显示低。如果经过测量实际水温确实低,那么可...
汽车空调没有热风 汽车空调没有... 当汽车空调缺乏热风时,可能是由多种原因造成的。首先,这可能源于发动机冷却系统的问题,或者是暖风控制机...
别克威朗怎么打开空调 别克威朗... 别克威朗空调使用方法及注意事项别克威朗的空调使用方法非常简单,只需按照以下步骤操作即可:1. 车辆启...
科三减速是踩刹车还是离合 科三... 当车辆在科三考试中需要减速时,应该根据车速来选择踩刹车还是离合。如果车速在3档以上且较快,学员可以直...