您的当前位置:首页>科技咨询>资讯详情

全球最大开源视频生成模型国内首发 阶跃星辰上

发表于:2025-02-21 15:00:02 浏览:37次 发布者: 网易互联网

每经杭州2月21日电(记者叶晓丹)在2月21日开幕的全球开发者大会(GDC)上,阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。截至目前,魔搭社区已上架超过4万个开源模型,涵盖LLM、对话、语音、文生图、图生视频等多个领域,是中国最大的AI模型社区。

此次在魔搭社区开源的两款模型,是近期全球多模态领域最热门的开源模型。Step-Video-T2V是基于300亿参数的文本转视频预训练模型,能够生成高达204帧的视频,在指令遵循、运动平滑性、物理合理性、美感度等方面表现均显著超过市面上既有的开源视频模型。

另一款上架模型Step-Audio,是业界首个产品级开源语音模型,参数规模多达1300多亿。根据Llama Question等5大主流公开测试,Step-Audio模型性能均位列第一,并在HSK-6(汉语水平考试六级)的测评中表现尤佳。

猜你喜欢

中国银河给予传媒互联网行业推荐评级:DeepSeek
中国银河给予传媒互联网行业推荐评级:DeepSeek
发表于:2025-03-02 浏览:41 发布者: 网易互联网
腾讯混元3D AI创作引擎正式上线
腾讯混元3D AI创作引擎正式上线
发表于:2025-01-21 浏览:48 发布者: 网易互联网
华为钱包,何以“碰”出未来?
华为钱包,何以“碰”出未来?
发表于:2025-04-30 浏览:25 发布者: 网易互联网
今年前5个月上海电子商务交易额超1.6万亿,同比
今年前5个月上海电子商务交易额超1.6万亿,同比
发表于:2025-06-14 浏览:19 发布者: 网易互联网
实探AWE:售价3万的AI床垫,厂家人员称更像噱头
实探AWE:售价3万的AI床垫,厂家人员称更像噱头
发表于:2025-03-23 浏览:23 发布者: 网易科技
净利177亿,但快手慢下来了
净利177亿,但快手慢下来了
发表于:2025-03-26 浏览:26 发布者: 网易互联网
当拼多多和字节跳动成为一种基础设施,它们会通往哪里?|| 大视野
当拼多多和字节跳动成为一种基础设施,它们会通往哪里?|| 大视野
发表于:2024-11-26 浏览:64 发布者: 新浪财经头条
小红书电商,走向“同温层”
小红书电商,走向“同温层”
发表于:2025-04-26 浏览:28 发布者: 网易互联网
【数智新时代 电商新价值】吉林:跨境电商跑出
【数智新时代 电商新价值】吉林:跨境电商跑出
发表于:2025-07-23 浏览:17 发布者: 网易互联网
网友发现,美团等多个线上平台新增原研药查询功
网友发现,美团等多个线上平台新增原研药查询功
发表于:2025-01-22 浏览:40 发布者: 网易互联网