您的当前位置:首页>科技咨询>资讯详情

阿里发布开源模型QwQ-32B:性能比肩DeepSeek-R1

发表于:2025-03-06 11:00:06 浏览:20次 发布者: 网易互联网

3月6日凌晨,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B。通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1,同时,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。

目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。同时,用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。


据悉,千问QwQ-32B是阿里探索推理模型的最新成果。在冷启动基础上,阿里通义团队针对数学和编程任务、通用能力分别进行了两轮大规模强化学习,在32B的模型尺寸上获得了令人惊喜的推理能力提升,应证了大规模强化学习可显著提高模型性能。

在一系列权威基准测试中,千问QwQ-32B 模型表现出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模型DeepSeek-R1:在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型;在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek- R1。

千问QwQ-32B既能提供极强的推理能力,又能满足更低的资源消耗需求,非常适合快速响应或对数据安全要求高的应用场景,开发者和企业可以在消费级硬件上轻松将其部署到本地设备中,进一步打造高度定制化的 AI 解决方案。

此外,千问QwQ-32B模型中还集成了与智能体 Agent 相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。阿里通义团队表示,未来将继续探索将智能体与强化学习的集成,以实现长时推理,探索更高智能进而最终实现AGI的目标。

目前,千问QwQ-32B已在魔搭社区、HuggingFace及GitHub等平台基于宽松的Apache2.0协议开源,所有人都可免费下载模型进行本地部署,或者通过阿里云百炼平台直接调用模型API服务。对于云端部署需求,用户可通过阿里云PAI平台完成快速部署,并进行模型微调、评测和应用搭建;或是选择容器服务 ACK 搭配阿里云 GPU 算力(如GPU 云服务器、容器计算服务ACS 等 ),实现模型容器化部署和高效推理。

从2023年至今,阿里通义团队已开源200多款模型,包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列,开源囊括文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等「全模态」,覆盖从0.5B到110B等参数「全尺寸」,截至目前,海内外AI开源社区中千问Qwen的衍生模型数量突破10万,超越美国Llama系列模型,成为全球最大的开源模型族群。(本文首发于钛媒体APP,作者|张帅,编辑|盖虹达)

猜你喜欢

豆包大模型家族全面升级,重磅发布视觉理解模型
豆包大模型家族全面升级,重磅发布视觉理解模型
发表于:2024-12-18 浏览:35 发布者: 网易互联网
扎克伯格继续挖人:苹果负责AI模型的高管将跳槽
扎克伯格继续挖人:苹果负责AI模型的高管将跳槽
发表于:2025-07-08 浏览:7 发布者: 网易科技
山姆宣布:加价!
山姆宣布:加价!
发表于:2025-01-17 浏览:34 发布者: 网易互联网
Keeta海外扩张再提速 美团、滴滴“狭路相逢”:
Keeta海外扩张再提速 美团、滴滴“狭路相逢”:
发表于:2025-05-14 浏览:17 发布者: 网易互联网
京东发言人回应“约谈不改变竞争策略”文件:造
京东发言人回应“约谈不改变竞争策略”文件:造
发表于:2025-05-17 浏览:12 发布者: 网易互联网
高效Attention引擎是怎样炼成的?陈天奇团队Fla
高效Attention引擎是怎样炼成的?陈天奇团队Fla
发表于:2025-01-23 浏览:22 发布者: 网易互联网
中国建筑科学研究院:繁荣“建鸿”生态,推进建筑科技产业升级
中国建筑科学研究院:繁荣“建鸿”生态,推进建筑科技产业升级
发表于:2024-11-27 浏览:55 发布者: ZOL中关村在线
AI 眼镜:你能做,我能做,谁都能做
AI 眼镜:你能做,我能做,谁都能做
发表于:2024-11-19 浏览:58 发布者: 网易科技
抖音电商升级治理虚假宣传:严打直播间违规营销
抖音电商升级治理虚假宣传:严打直播间违规营销
发表于:2025-06-11 浏览:11 发布者: 网易互联网
网易有道宣布全面拥抱DeepSeek-R1
网易有道宣布全面拥抱DeepSeek-R1
发表于:2025-02-06 浏览:25 发布者: 网易互联网