您的当前位置:首页>科技咨询>资讯详情

事关DeepSeek,腾讯宣布重大更新!

发表于:2025-03-26 13:00:03 浏览:17次 发布者: 网易互联网

3月26日凌晨,腾讯元宝迎来重大升级,同时接入两大模型:深度思考模型“腾讯混元T1”正式版,和DeepSeek V3-0324最新版。


升级后,元宝的能力全面增强,在编程、数学推理和长文本处理等场景中的表现更加出色。

其中,混元T1正式版,基于新一代快思考模型Turbo S底座升级,是一款能秒回、吐字快、擅长超长文处理的强推理模型,创新采用混合Mamba架构,性能保持业界领先,适合处理学术论文、策划方案、长篇内容等各类深度思考任务;

元宝部署的DeepSeek V3最新版,则擅长快速生成,一句话指令就能写代码,更强的前端开发能力,实现网站和App开发。解数学题、文本创作的表现也较前代更快更准,能胜任各类高频使用场景。

值得一提的是,腾讯元宝是最早一批接入 DeepSeek V3-0324版本的AI应用,从模型开源到上线仅用1天。

目前,腾讯元宝的“混元+DeepSeek”双模型均支持深度思考和秒出答案。近期,元宝持续高频更新,35天迭代30个版本,不断上线实用功能。所有能力均免费开放、不限次数,覆盖更多工作、学习和生活场景。

腾讯表示,腾讯元宝将继续坚持双模,始终为用户提供更好的、更先进的模型,并第一时间部署,为大家打造“好用的 AI”。

此前,3月21日深夜,腾讯宣布推出自研深度思考模型混元T1正式版,并同步在腾讯云官网上线。

据腾讯介绍,混元T1正式版通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,推理能力得到进一步提升。与此前已上线腾讯元宝的混元T1-preview模型相比,综合效果也有了明显提升。

在一些常见的基准测试上,比如大语言模型评估增强数据集MMLU-PRO中,混元T1的评分仅次于OpenAI-o1,优于DeepSeek-R1。


在评估逻辑推理能力的DROP F1测试中,混元T1的评分也优于DeepSeek-R1和OpenAI-o1。不过在数学和代码能力测试中,混元T1的评分都低于DeepSeek-R1。在中文语言理解能力方面,混元T1与DeepSeek-R1的评分齐平。

整体来看,混元T1正式版的成绩已经达到了业界领先推理模型的水平。但腾讯官方此次并未披露混元T1的参数量级,所以并不清楚其是用多少训练数据实现这一性能。

编辑|段炼 盖源源

校对|刘思琦

封面图片:视觉中国

每日经济新闻综合自每经网、腾讯云、21世纪经济报道、公开资料等

猜你喜欢

DeepSeek开源周one more thing:V3/R1推理系统
DeepSeek开源周one more thing:V3/R1推理系统
发表于:2025-03-01 浏览:17 发布者: 网易互联网
腾讯音乐拟收购喜马拉雅控股;苹果称Siri的AI升
腾讯音乐拟收购喜马拉雅控股;苹果称Siri的AI升
发表于:2025-06-11 浏览:3 发布者: 网易互联网
对现状不满?Meta组建新AI团队,又豪掷百亿入股
对现状不满?Meta组建新AI团队,又豪掷百亿入股
发表于:2025-06-11 浏览:1 发布者: 网易科技
线上购买享受“国补”的3C数码产品,现场签收、
线上购买享受“国补”的3C数码产品,现场签收、
发表于:2025-02-21 浏览:18 发布者: 网易互联网
双十一买手机看这四款就足够了 基本不存在硬件短板!
双十一买手机看这四款就足够了 基本不存在硬件短板!
发表于:2024-11-01 浏览:37 发布者: CNMO
用短剧解锁视听新打法,中国移动咪咕让科普传播
用短剧解锁视听新打法,中国移动咪咕让科普传播
发表于:2025-03-28 浏览:16 发布者: 网易互联网
B站发布2024年Q4及全年财报:广告、游戏收入持
B站发布2024年Q4及全年财报:广告、游戏收入持
发表于:2025-02-21 浏览:13 发布者: 网易互联网
参透美团的2024:生态建设成必备课题,科技和出
参透美团的2024:生态建设成必备课题,科技和出
发表于:2025-03-25 浏览:16 发布者: 网易互联网
美团AI编程Agent工具NoCode上线
美团AI编程Agent工具NoCode上线
发表于:2025-06-10 浏览:2 发布者: 网易互联网
“图书直播”成常态 流量如何变“留量”?
“图书直播”成常态 流量如何变“留量”?
发表于:2025-01-16 浏览:27 发布者: 网易互联网