您的当前位置:首页>科技咨询>资讯详情

通义万相开源新模型 指定首尾图片可生成延时摄

发表于:2025-04-18 14:00:05 浏览:22次 发布者: 网易互联网

每经记者:叶晓丹 每经编辑:杨夏

每经杭州4月18日电(记者叶晓丹)记者从阿里云获悉,4月17日晚,阿里巴巴开源通义万相“首尾帧生视频14B模型”,这是业界首个开源的百亿级参数规模首尾帧生视频模型,它可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的720p高清视频,满足延时摄影、变身等更可控、更定制化的视频生成需求。用户可在通义万相官网直接免费体验该模型,或在GitHub、Hugging Face、魔搭社区下载模型本地部署后进行二次开发。

首尾帧生视频比文生视频、单图生视频的可控性更高,是最受AI(人工智能)视频创作者欢迎的功能之一,但这类模型的训练难度较大,对模型的指令遵循、视频内容与首尾帧一致性、视频过渡自然流畅性等均有高要求。

据介绍,基于现有的Wan2.1文生视频基础模型架构,通义万相首尾帧生视频模型进一步引入了额外的条件控制机制,通过该机制可实现流畅且精准的首尾帧变换;在训练阶段,团队还构建了专门用于首尾帧模式的训练数据,同时针对文本与视频编码模块、扩散变换模型模块采用了并行策略,这些策略提升了模型训练和生成效率,也保障了模型具备高分辨率视频生成的效果。

猜你喜欢

美国AI购物应用Nate创始人被控欺诈:实际由人类
美国AI购物应用Nate创始人被控欺诈:实际由人类
发表于:2025-04-14 浏览:25 发布者: 网易互联网
研究人员总结业界 170 余种虚拟现实输入方式,
研究人员总结业界 170 余种虚拟现实输入方式,
发表于:2025-04-13 浏览:29 发布者: 网易科技
冲上热搜,刘强东和李斌一起点外卖
冲上热搜,刘强东和李斌一起点外卖
发表于:2025-04-09 浏览:31 发布者: 网易互联网
网传罗永浩 AI 创业项目和百度合作,知情人士称
网传罗永浩 AI 创业项目和百度合作,知情人士称
发表于:2025-05-19 浏览:24 发布者: 网易科技
昔日巨头接连受挫,领先只剩1-3年,日本功率芯
昔日巨头接连受挫,领先只剩1-3年,日本功率芯
发表于:2025-08-20 浏览:10 发布者: 网易IT
大V云集的“V聚场”:是起点,是机会,也是归属
大V云集的“V聚场”:是起点,是机会,也是归属
发表于:2025-07-17 浏览:18 发布者: 网易互联网
东风汽车发布天元智能品牌:构建一核双基双元智
东风汽车发布天元智能品牌:构建一核双基双元智
发表于:2025-04-24 浏览:44 发布者: 网易IT
美团到店「反围剿」:从组织变革,到核销暗战
美团到店「反围剿」:从组织变革,到核销暗战
发表于:2025-02-06 浏览:32 发布者: 网易互联网
B站第三季营收73.1亿:同比增26% 首次实现单季
B站第三季营收73.1亿:同比增26% 首次实现单季
发表于:2024-11-14 浏览:83 发布者: 网易互联网
再度合作春晚,小红书这次瞄准了什么?
再度合作春晚,小红书这次瞄准了什么?
发表于:2025-01-17 浏览:46 发布者: 网易互联网