您的当前位置:首页>科技咨询>资讯详情

阿里“最强开源模型”,昇腾、海光已适配

发表于:2025-04-29 16:00:16 浏览:14次 发布者: 网易互联网

4月29日凌晨,阿里新一代通义千问模型Qwen3发布并开源,它的参数量仅为DeepSeek-R1的1/3,但成本大幅下降,性能超越R1、OpenAI-o1等全球顶尖模型,被媒体称为“全球最强开源模型”。

随后,华为计算官方发文称,此次Qwen3系列一经发布开源,即在MindSpeed和MindIE中开箱即用,实现Qwen3的0Day适配。海光信息方面也表示,海光DCU迅速完成对全部8款模型的无缝适配+调优。

根据阿里云官方信息,此次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数);以及六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

其中的旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相比,表现出极具竞争力的结果。


此外,小型MoE模型Qwen3-30B-A3B的激活参数数量是QwQ-32B的10%,表现更胜一筹,甚至像Qwen3-4B这样的小模型也能匹敌Qwen2.5-72B-Instruct的性能。


Qwen3是国内首个“混合推理模型”,模型支持两种思考模式:思考模式:在这种模式下,模型会逐步推理,经过深思熟虑后给出最终答案。这种方法适合需要深入思考的复杂问题。非思考模式:在此模式中,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。

在预训练方面,Qwen3的数据集相比Qwen2.5有了显著扩展。Qwen2.5是在18万亿个token上进行预训练的,而Qwen3使用的数据量几乎是其两倍,达到了约36万亿个token,涵盖了119种语言和方言。

从官方数据来看,在考察代码能力的LiveCodeBench评测中,Qwen3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard的测评中,Qwen3分别以95.6分超越了OpenAI-o1及DeepSeek-R1;在评估奥数水平的AIME25测评中,Qwen3以81.5分刷新开源记录。

Qwen3发布后,华为计算方面发文称,此前昇腾MindSpeed和MindIE一直同步支持Qwen系列模型,此次Qwen3系列一经发布开源,即在MindSpeed和MindIE中开箱即用,实现Qwen3的0Day适配。

随后海光信息也表示,在“深算智能”战略引领下,海光DCU迅速完成对全部8款模型的无缝适配+调优,覆盖235B/32B/30B/14B/8B/4B/1.7B/0.6B,实现零报错、零兼容性问题的秒级部署。

本文系观察者网独家稿件,未经授权,不得转载。

猜你喜欢

快手:AI大模型预计可把客户短视频营销素材制作
快手:AI大模型预计可把客户短视频营销素材制作
发表于:2025-03-25 浏览:18 发布者: 网易互联网
这个春天,快手电商给不断进化的“中国制造”添
这个春天,快手电商给不断进化的“中国制造”添
发表于:2025-05-15 浏览:11 发布者: 网易互联网
京东美团为何“互掐”?
京东美团为何“互掐”?
发表于:2025-04-22 浏览:14 发布者: 网易互联网
500Hz OLED即将面世
500Hz OLED即将面世
发表于:2024-11-26 浏览:47 发布者: 新浪财经头条
消费市场“新线引力”大爆发 “新线市场+AI”能
消费市场“新线引力”大爆发 “新线市场+AI”能
发表于:2025-04-19 浏览:13 发布者: 网易互联网
罗马仕京东、淘宝、拼多多官方旗舰店已关闭
罗马仕京东、淘宝、拼多多官方旗舰店已关闭
发表于:2025-07-07 浏览:7 发布者: 网易互联网
AI新闻日历|3场发布会聚焦金融经济;最短“三
AI新闻日历|3场发布会聚焦金融经济;最短“三
发表于:2025-07-11 浏览:9 发布者: 网易互联网
刘强东参加京东物流新春家宴:感谢一线员工,感
刘强东参加京东物流新春家宴:感谢一线员工,感
发表于:2025-01-26 浏览:27 发布者: 网易互联网
14个产品接入,腾讯“搭车”DeepSeek
14个产品接入,腾讯“搭车”DeepSeek
发表于:2025-02-17 浏览:24 发布者: 网易互联网
阿维塔10月销量10056辆 同比环比皆翻倍创历史新高
阿维塔10月销量10056辆 同比环比皆翻倍创历史新高
发表于:2024-11-02 浏览:52 发布者: CNMO