国产算力平台纷纷接入阿里千问QwQ,前三大开源
阿里云通义千问系列模型近期迎来重大进展:通义千问QwQ-32B开源,国家超算互联网平台、算能科技、壁仞科技等机构相继宣布接入通义千问QwQ-32B推理模型或推出专属一体机,与此同时,通义千问衍生模型数量突破10万个,超越美国Meta公司的Llama系列,稳居全球规模最大AI模型群,并且在海外被Camel.AI、SambaNova Cloud等部署上云,对外提供API服务。
国产算力平台加速适配QwQ-32B
3月9日,国家超算互联网平台正式上线通义千问QwQ-32B API服务,向用户提供免费100万tokens的试用额度。该模型以320亿参数量实现性能突破,在数学、代码及通用能力的多项权威评测中,表现与参数规模更大的DeepSeek-R1模型相当。
除了国家超算互联网平台,国产算力平台纷纷接入阿里千问QwQ。算能科技官方公众号显示,算能SophNet平台火速上线了QwQ-32B大模型,开发者仅需创建服务时选择QwQ-32B模型,即可完成API配置;硅基流动 SiliconCloud 也在第一时间上线了推理加速版 QwQ-32B,免去开发者部署门槛;同期,壁仞科技推出QwQ-32B大模型一体机,通过软硬件协同优化实现75TPS(每秒处理75万条请求)的推理速度;青云科技AI算力云平台亦上线该模型,进一步降低企业部署门槛;同期,东南大学等科研机构也宣布接入QwQ-32B,目的在于推动学术研究与产业应用结合。
技术突破:小参数量实现强劲推理性能
3月6日凌晨,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B,当天即登顶HuggingFace全球大模型榜单榜首。通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1,在消费级显卡比如家用电脑上也能实现本地部署。用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。
这一突破不仅降低算力成本,更适配国产芯片与算力平台,为中国AI自主化提供关键支撑。有消息称,阿里云未来还将发布基于Qwen2.5-Max的推理模型,其复杂任务处理能力及推理能力还将大幅提升。
全球开源生态领跑者 前三大开源模型中 2席为中国公司
自2023年开源以来,阿里千问模型家族已覆盖0.5B至110B参数的全尺寸版本,衍生模型数量超10万个,覆盖自然语言处理、代码生成、多模态交互等场景,在HuggingFace社区,通义千问持续领跑,仅Qwen2.5-1.5B一款模型,就占2024年全球模型下载量的26.6%,位居第一。有观点认为,全球前三大开源模型中是阿里千问、DeepSeek、Llama,中国模型公司占了2席,由于其丰富的模型生态,千问系列模型在产业界实际应用或比DeepSeek R1更为广泛。