您的当前位置:首页>科技咨询>资讯详情

阿里开源全能视频大模型,单一模型全面支持视频

发表于:2025-05-15 01:00:45 浏览:17次 发布者: 网易互联网

每经杭州5月14日电(记者叶晓丹)5月14日晚,《每日经济新闻》记者获悉,阿里巴巴正式开源通义万相Wan2.1-VACE,这是业界功能最全的视频生成与编辑模型,单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力。本次共开源1.3B和14B两个版本,其中1.3B版本可在消费级显卡运行。

据阿里云方面介绍,Wan2.1-VACE基于通义万相文生视频模型研发,同时创新性提出了全新的视频条件单元(VCU),它在输入形态上统一了文生视频、参考图生视频、视频生视频,基于局部区域的视频生视频4大类视频生成和编辑任务;同时,Wan2.1-VACE还进一步解决了多模态输入的token(词元)序列化难题,将VCU输入的帧序列进行概念解耦,分开重构成可变序列和不可变序列后进行编码。

据了解,自今年2月以来,通义万相已先后开源文生视频模型、图生视频模型和首尾帧生视频模型,目前在开源社区的下载量已超330万。

猜你喜欢

腾讯元宝回应用户协议含“霸王条款”:意见已经
腾讯元宝回应用户协议含“霸王条款”:意见已经
发表于:2025-03-05 浏览:20 发布者: 网易互联网
双十一大促考验快递无人车,降本增效究竟怎样实
双十一大促考验快递无人车,降本增效究竟怎样实
发表于:2024-10-30 浏览:51 发布者: 网易互联网
经济日报:加大网络直播营销监管力度
经济日报:加大网络直播营销监管力度
发表于:2025-01-24 浏览:26 发布者: 网易互联网
优步(UBER.US)携手文远知行(WRD.US)于迪拜首次
优步(UBER.US)携手文远知行(WRD.US)于迪拜首次
发表于:2025-04-02 浏览:18 发布者: 网易互联网
Meta向全球广告商开放Threads
Meta向全球广告商开放Threads
发表于:2025-04-24 浏览:21 发布者: 网易科技
3A游戏风险高:《龙腾4》博主揭示,只有进入在线榜前十才能有效减亏
3A游戏风险高:《龙腾4》博主揭示,只有进入在线榜前十才能有效减亏
发表于:2024-11-06 浏览:40 发布者: ZOL中关村在线
OpenAI CFO重磅曝料:AGI近在咫尺,全球最强编
OpenAI CFO重磅曝料:AGI近在咫尺,全球最强编
发表于:2025-04-19 浏览:18 发布者: 网易互联网
三只松鼠:已上线饿了么闪购
三只松鼠:已上线饿了么闪购
发表于:2025-07-17 浏览:7 发布者: 网易互联网
百度回应高管女儿“开盒”事件;长安汽车人形机
百度回应高管女儿“开盒”事件;长安汽车人形机
发表于:2025-03-19 浏览:25 发布者: 网易互联网
美团全面拓展即时零售,闪购、小象、优选“三箭
美团全面拓展即时零售,闪购、小象、优选“三箭
发表于:2025-06-24 浏览:7 发布者: 网易互联网