您的当前位置:首页>科技咨询>资讯详情

通义千问首个图像生成基础模型Qwen-Image开源

发表于:2025-08-05 09:00:04 浏览:0次 发布者: 网易互联网

今日,通义千问宣布开源Qwen-Image,一个20B的MMDiT模型,是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得了显著进展。


官方介绍,Qwen-Image的主要特性包括:

卓越的文本渲染能力:Qwen-Image 在复杂文本渲染方面表现出色,支持多行布局、段落级文本生成以及细粒度细节呈现。无论是英语还是中文,均能实现高保真输出。

一致性的图像编辑能力:通过增强的多任务训练范式,Qwen-Image 在编辑过程中能出色地保持编辑的一致性。

强大的跨基准性能表现:在多个公开基准测试中的评估表明,Qwen-Image 在各类生成与编辑任务中均获得SOTA,是一个强大的图像生成基础模型。

猜你喜欢

阿里又把业务集中起来了
阿里又把业务集中起来了
发表于:2025-06-24 浏览:8 发布者: 网易互联网
“差评莫名其妙消失了”!是谁在互联网平台操控
“差评莫名其妙消失了”!是谁在互联网平台操控
发表于:2025-07-08 浏览:8 发布者: 网易互联网
买5单退4单!网购退货率攀升打开新市场 快递物
买5单退4单!网购退货率攀升打开新市场 快递物
发表于:2024-12-19 浏览:55 发布者: 网易互联网
微软GUI智能体OmniParser二代开源!推理延迟降
微软GUI智能体OmniParser二代开源!推理延迟降
发表于:2025-03-07 浏览:25 发布者: 网易互联网
DeepSeek加速产业落地 AI眼镜迎来发展机遇期
DeepSeek加速产业落地 AI眼镜迎来发展机遇期
发表于:2025-02-07 浏览:28 发布者: 网易科技
马斯克:中国用户对FSD最为苛刻 特斯拉机器人
马斯克:中国用户对FSD最为苛刻 特斯拉机器人
发表于:2025-04-23 浏览:17 发布者: 网易IT
潘乱对谈小宇宙 CEO Kyth:播客是在饱和时代,
潘乱对谈小宇宙 CEO Kyth:播客是在饱和时代,
发表于:2024-12-18 浏览:60 发布者: 网易互联网
快手“换挡”AI
快手“换挡”AI
发表于:2025-03-26 浏览:21 发布者: 网易互联网
直播带货狂卷东南亚,连“越南薇娅”都开始焦虑
直播带货狂卷东南亚,连“越南薇娅”都开始焦虑
发表于:2025-01-16 浏览:39 发布者: 网易互联网
NASA核动力直升机将前往土卫六 SpaceX 2028年负
NASA核动力直升机将前往土卫六 SpaceX 2028年负
发表于:2024-11-26 浏览:44 发布者: 网易科技