您的当前位置:首页>科技咨询>资讯详情

腾讯开源推理模型!13B参数比肩OpenAI o1,1张G

发表于:2025-06-29 03:44:50 浏览:1次 发布者: 网易互联网


智东西
作者 王涵
编辑 漠影

智东西6月27日报道,今日,腾讯混元宣布开源首个混合推理MoE模型Hunyuan-A13B,总参数80B,激活参数仅13B,是元首个开源推理模型,腾讯将其称为“业界首个13B级别的MoE开源混合推理模型”。


▲腾讯混元Github页面(图源:Github)

Hunyuan-A13B模型是腾讯内部应用和调用量最大的大语言模型之一,有超过400+业务用于精调或者直接调用,日均请求超1.3亿。与其之前开源的混元large相比,Hunyuan-A13B参数更小,但是性能和效果都有一定提升。

在官方发布的基准测试上,Hunyuan-A13B模型在数学、推理、Agent调用等能力上超越Qwen3-A22B、DeepSeek-R1-0120以及OpenAI-o1-1217,甚至在长文本上能和Gemini 2.5 pro“掰手腕”。

在用户端进入Hunyuan-A13B模型主页后,可以选择开启“快思考”模式,“快思考”模式提供简洁、高效的输出,适合追求速度和最小计算开销的简单任务,如不点击按钮,则默认为“慢思考”模式,可以输出更深、更全面的推理步骤,如反思和回溯等。


此外,在开发者方面,Hunyuan-A13B模型对个人开发者较为友好,在严格条件下,开发者只需要1张中低端GPU卡即可部署。目前,Hunyuan-A13B已经融入开源主流推理框架生态,无损支持多种量化格式,在相同输入输出规模上,整体吞吐是前沿开源模型的2倍以上

即日起,模型已经在Github和Hugging Face等开源社区上线,同时模型API也在腾讯云官网正式上线,支持快速接入部署。

体验入口:https://hunyuan.tencent.com/

API地址:https://cloud.tencent.com/product/tclm

Github :https://github.com/Tencent-Hunyuan

HuggingFace:https://huggingface.co/tencent

一、激活参数13B,性能直追OpenAI o1

测试结果显示,Hunyuan-A13B在数学能力、推理能力以及Agent调用能力上表现较佳,在多个基准测试榜单中超越Qwen3-A22B、DeepSeek-R1-0120以及OpenAI-o1-1217。


▲Hunyuan-Large基准测试数据(图源:腾讯混元)

在长文方面,Hunyuan-A13B支持256K原生上下文窗口,在PenguinScrolls和LongBench-v2长文数据集中超越DeepSeek R1和Qwen3-A22B,仅次于第一名Gemini 2.5 pro。



二、20T tokens预训练+MoE架构优化:腾讯混元A13B大模型核心技术突破

预训练环节,Hunyuan-A13B训练了20T tokens的语料,覆盖了多个领域。此外,在模型架构上,腾讯混元团队构建了适用于MoE架构的Scaling Law联合公式,可以进一步提升模型预训练的效果。

在后训练环节,Hunyuan-A13B采用了多阶段的训练方式,同时兼顾了模型创作、理解、Agent等通用能力。


▲Hunyuan-A13B后训练四个步骤(图源:腾讯混元)

对于时下热门的大模型Agent能力,腾讯混元建设了一套多Agent数据合成框架,接入了MCP、沙箱、大语言模型模拟等多种环境,通过强化学习让Agent在多种环境里进行自主探索与学习,进一步提升了Hunyuan-A13B的效果。

此外,腾讯混元还开源了两个新的数据集。其中,ArtifactsBench构建了一个包含1825个任务的新基准,涵盖了从网页开发、数据可视化到交互式游戏等九大领域,并按难度分级以全面评估模型的能力。

C3-Bench则针对Agent场景模型面临的三个关键挑战:规划复杂的工具关系、处理关键的隐藏信息以及动态路径决策,设计了1024条测试数据,以发现模型能力的不足。

结语:腾讯混元构建开源AI生态

腾讯混元旗下图像、视频、3D、文本等多种模态基础模型已全面开源。未来,混元还计划推出多尺寸混合推理模型,从0.5B到32B的dense模型,以及激活13B的MoE模型,以适配企业与端侧不同需求,混元图像、视频、3D等多模态基础模型及配套插件模型也将持续开源。

值得注意的是,此次腾讯混元在开源Hunyuan-A13B模型的同时,还配套开源了ArtifactsBench和C3-Bench两大专业评测数据集,这一举措展现了科技大厂参与行业标准制定的积极姿态,体现了腾讯混元推动大模型技术生态共建的责任。

猜你喜欢

爱奇艺开启视频娱乐“短”时代 进军线下乐园和
爱奇艺开启视频娱乐“短”时代 进军线下乐园和
发表于:2025-04-23 浏览:13 发布者: 网易互联网
字节跳动因代码抄袭被判赔8266.8万元,涉抖音等
字节跳动因代码抄袭被判赔8266.8万元,涉抖音等
发表于:2025-02-13 浏览:22 发布者: 网易互联网
独家 | Google 决定终止开源 Android
独家 | Google 决定终止开源 Android
发表于:2025-03-27 浏览:14 发布者: 网易互联网
Scale AI宣布获Meta重大新投资,公司估值超290
Scale AI宣布获Meta重大新投资,公司估值超290
发表于:2025-06-13 浏览:8 发布者: 网易科技
美团外卖要退出江苏宿迁?美团客服回应:谣言,
美团外卖要退出江苏宿迁?美团客服回应:谣言,
发表于:2025-05-01 浏览:11 发布者: 网易互联网
任天堂:Switch 2 游戏机顶部的 USB-C 接口不支
任天堂:Switch 2 游戏机顶部的 USB-C 接口不支
发表于:2025-04-08 浏览:14 发布者: 网易科技
UBBF2024 | 自动驾驶网络峰会在伊斯坦布尔圆满召开
UBBF2024 | 自动驾驶网络峰会在伊斯坦布尔圆满召开
发表于:2024-11-05 浏览:49 发布者: ZOL中关村在线
破解婚托乱象,青藤之恋红娘团队打造婚恋服务新
破解婚托乱象,青藤之恋红娘团队打造婚恋服务新
发表于:2025-04-10 浏览:13 发布者: 网易互联网
小米 YU7 内饰曝光;OpenAI 发布 GPT-4.1 新模
小米 YU7 内饰曝光;OpenAI 发布 GPT-4.1 新模
发表于:2025-04-15 浏览:18 发布者: 网易互联网
Anthropic预测:2025是智能体系统年!年终总结
Anthropic预测:2025是智能体系统年!年终总结
发表于:2024-12-24 浏览:42 发布者: 网易互联网