您的当前位置:首页>科技咨询>资讯详情

阿里开源首个全模态大模型Qwen2.5-Omni

发表于:2025-03-27 13:00:06 浏览:13次 发布者: 网易互联网

大象新闻记者 李莉 张迪驰

3月27日凌晨,阿里巴巴发布并开源首个端到端全模态大模型通义千问Qwen2.5-Omni-7B,大象新闻记者了解到,该模型可同时处理文本、图像、音频及视频输入,并实时生成文本与自然语音输出。在权威的多模态融合任务OmniBench等测评中,Qwen2.5-Omni以全维度领先表现刷新业界纪录,大幅超越Google Gemini-1.5-Pro等同类模型,成为目前全球性能最强的全模态大模型。


据介绍,Qwen2.5-Omni采用通义团队首创的Thinker-Talker双核架构与TMRoPE位置编码算法,构建了类人“大脑”与“发声器”协同的端到端架构。通过实时流式处理,模型能统一感知所有模态信息,并高效完成语义理解与语音生成。其创新性的位置嵌入技术还实现了音视频时序对齐,使模型能以接近人类的多感官方式“立体”认知世界,甚至在交互中识别情绪,为复杂任务提供更智能、自然的反馈与决策支持。

在同等规模单模态权威基准测试中,Qwen2.5-Omni展现出跨模态的全面优势:语音理解、图片/视频解析等能力均超越专业单模态模型,其语音生成测评分数达4.51分,与人类水平持平。尤为重要的是,该模型仅以7B参数规模实现了上述突破,大幅降低全模态大模型的产业应用门槛。开发者可免费下载商用,手机等终端设备也能轻松部署运行。

目前,Qwen2.5-Omni已在魔搭社区、Hugging Face平台开源,用户还可通过Qwen Chat直接体验其多模态交互能力。

猜你喜欢

多家电商平台对“仅退款”规则进行重大调整,淘
多家电商平台对“仅退款”规则进行重大调整,淘
发表于:2025-04-22 浏览:11 发布者: 网易互联网
“反浪费”成为餐饮服务的常态功能 美团已有4.8
“反浪费”成为餐饮服务的常态功能 美团已有4.8
发表于:2024-11-27 浏览:38 发布者: 网易互联网
徽商银行某项目招标:百度报价不到对手一半竟然落选?
徽商银行某项目招标:百度报价不到对手一半竟然落选?
发表于:2024-11-05 浏览:42 发布者: 运营商财经网
淘宝新功能!屏蔽高退款人群
淘宝新功能!屏蔽高退款人群
发表于:2025-05-13 浏览:9 发布者: 网易互联网
OTA首家!同程程心大模型接入DeepSeek
OTA首家!同程程心大模型接入DeepSeek
发表于:2025-02-28 浏览:15 发布者: 网易互联网
马斯克想废除美国大量政府规章,放松企业监管,
马斯克想废除美国大量政府规章,放松企业监管,
发表于:2024-12-18 浏览:31 发布者: 网易IT
刘擎教授:愿AI发展过程中人文精神长存于心
刘擎教授:愿AI发展过程中人文精神长存于心
发表于:2024-11-13 浏览:42 发布者: ZOL中关村在线
学俞敏洪上线自营App,疯狂小杨哥因“翻车”付
学俞敏洪上线自营App,疯狂小杨哥因“翻车”付
发表于:2025-04-10 浏览:12 发布者: 网易互联网
微信朋友圈“罢工”,冲上热搜!
微信朋友圈“罢工”,冲上热搜!
发表于:2024-12-19 浏览:37 发布者: 网易互联网
抖音:2024年封禁欺诈、水军和违规导流相关黑产
抖音:2024年封禁欺诈、水军和违规导流相关黑产
发表于:2025-01-13 浏览:44 发布者: 网易互联网