您的当前位置:首页>科技咨询>资讯详情

阿里开源全能视频大模型,单一模型全面支持视频

发表于:2025-05-15 01:00:45 浏览:16次 发布者: 网易互联网

每经杭州5月14日电(记者叶晓丹)5月14日晚,《每日经济新闻》记者获悉,阿里巴巴正式开源通义万相Wan2.1-VACE,这是业界功能最全的视频生成与编辑模型,单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力。本次共开源1.3B和14B两个版本,其中1.3B版本可在消费级显卡运行。

据阿里云方面介绍,Wan2.1-VACE基于通义万相文生视频模型研发,同时创新性提出了全新的视频条件单元(VCU),它在输入形态上统一了文生视频、参考图生视频、视频生视频,基于局部区域的视频生视频4大类视频生成和编辑任务;同时,Wan2.1-VACE还进一步解决了多模态输入的token(词元)序列化难题,将VCU输入的帧序列进行概念解耦,分开重构成可变序列和不可变序列后进行编码。

据了解,自今年2月以来,通义万相已先后开源文生视频模型、图生视频模型和首尾帧生视频模型,目前在开源社区的下载量已超330万。

猜你喜欢

欧盟法院裁定谷歌(GOOGL.US)拒绝第三方访问Andr
欧盟法院裁定谷歌(GOOGL.US)拒绝第三方访问Andr
发表于:2025-02-25 浏览:23 发布者: 网易互联网
采样越多越聪明?隐式扩展颠覆认知,采样搜索如
采样越多越聪明?隐式扩展颠覆认知,采样搜索如
发表于:2025-04-21 浏览:16 发布者: 网易互联网
Meta发布AI新模型系列Llama 4
Meta发布AI新模型系列Llama 4
发表于:2025-04-06 浏览:20 发布者: 网易科技
封面有数|2024年网约车行业加速变革 年内已新
封面有数|2024年网约车行业加速变革 年内已新
发表于:2024-12-25 浏览:43 发布者: 网易互联网
消息称吉利银河星舰7预计于11月4日亮相,搭载新一代雷神超级电混技术
消息称吉利银河星舰7预计于11月4日亮相,搭载新一代雷神超级电混技术
发表于:2024-10-31 浏览:43 发布者: ZOL中关村在线
芒果超媒:旗下内容电商平台主营包含IP周边及衍
芒果超媒:旗下内容电商平台主营包含IP周边及衍
发表于:2024-11-28 浏览:40 发布者: 网易互联网
荷兰大臣劝民众“买中国货前三思”,结果…
荷兰大臣劝民众“买中国货前三思”,结果…
发表于:2025-03-26 浏览:19 发布者: 网易互联网
百度智能云将投入1000万元资金扶持合作伙伴
百度智能云将投入1000万元资金扶持合作伙伴
发表于:2025-04-26 浏览:19 发布者: 网易互联网
DHL西南国际快件转运中心在成都投运,业务处理
DHL西南国际快件转运中心在成都投运,业务处理
发表于:2024-12-18 浏览:38 发布者: 网易互联网
大人们的玩具,迎来万亿风口
大人们的玩具,迎来万亿风口
发表于:2025-03-14 浏览:24 发布者: 网易科技