您的当前位置:首页>科技咨询>资讯详情

阿里巴巴发布新一代端到端多模态旗舰模型Qwen2.

发表于:2025-03-27 11:00:03 浏览:13次 发布者: 网易互联网

阿里巴巴发布了新一代端到端多模态旗舰模型Qwen2.5-Omni,号称具备全方位多模态感知能力,看听说写样样精通。

采用全新的Thinker-Talker双核架构,Thinker模块负责处理多模态输入并生成语义表征和文本内容,Talker模块则负责将这些信息转化为流畅的语音输出。这种架构实现了端到端的统一,支持实时音视频交互和流畅的语音生成。

能够无缝处理文本、图像、音频和视频等多种输入形式,并同时生成文本和语音输出。支持分块输入和即时输出,实现真正的实时交互。

已在Hugging Face、ModelScope、DashScope和GitHub等平台开源,方便开发者体验和使用。

相比现有方案,语音生成的自然度和稳定性更高。在音频能力上优于同等规模的Qwen2-Audio,与Qwen2.5-VL-7B保持同等水平。在语音指令理解方面表现出色,效果可媲美文本输入。

猜你喜欢

百度点亮自研三万卡集群,支持1000个客户同时做
百度点亮自研三万卡集群,支持1000个客户同时做
发表于:2025-04-25 浏览:8 发布者: 网易互联网
押宝入境游和AI,携程离 “全球第一” 还有多远
押宝入境游和AI,携程离 “全球第一” 还有多远
发表于:2025-02-26 浏览:20 发布者: 网易互联网
瞄准AI,阿里又有新动作
瞄准AI,阿里又有新动作
发表于:2025-04-11 浏览:13 发布者: 网易科技
时隔三个多月,三只羊旗下自营品牌正式复播卖年
时隔三个多月,三只羊旗下自营品牌正式复播卖年
发表于:2025-01-13 浏览:71 发布者: 网易互联网
网易捐赠800万元物资 驰援西藏
网易捐赠800万元物资 驰援西藏
发表于:2025-01-07 浏览:33 发布者: 网易互联网
送礼物,微信电商的关键一枪
送礼物,微信电商的关键一枪
发表于:2024-12-20 浏览:27 发布者: 网易互联网
声网刘斌:“Her”真正落地实现离不开RTE能力的
声网刘斌:“Her”真正落地实现离不开RTE能力的
发表于:2024-12-27 浏览:22 发布者: 网易互联网
广州:推进数据跨境安全有序流动
广州:推进数据跨境安全有序流动
发表于:2025-05-07 浏览:10 发布者: 网易互联网
品类即主角,内容即主场:抖音电商的618新剧本
品类即主角,内容即主场:抖音电商的618新剧本
发表于:2025-05-26 浏览:8 发布者: 网易互联网
2024“双十一”新动向:“他经济”正在崛起
2024“双十一”新动向:“他经济”正在崛起
发表于:2024-11-13 浏览:44 发布者: 网易互联网