您的当前位置:首页>科技咨询>资讯详情

腾讯推出自研深度思考模型混元T1,输入价格为1

发表于:2025-03-22 16:00:02 浏览:18次 发布者: 网易互联网

3月21日,腾讯宣布推出自研深度思考模型“混元T1”正式版,并同步在腾讯云官网上线。

该模型以腾讯于3月初发布的“混元Turbo S”为基座打造,是一款能秒回、吐字快、擅长超长文处理的强推理模型。

通过大规模强化学习并结合专项优化,混元T1正式版进一步提升了推理能力。与此前已上线腾讯元宝的“混元T1-preview”模型相比,综合效果明显提升。

混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。这是工业界首次将混合Mamba架构无损应用于超大型推理模型。

这一架构有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache(一种大模型推理性能优化技术)的内存占用,从而显著降低了训练和推理成本,让混元T1实现首字秒出,吐字速度最快可达80tokens/s(Token意为处理文本的最小单元)。

目前,混元T1已在腾讯云官网上线,输入价格为1元/每百万tokens,输出价格为4元/百万tokens 。

猜你喜欢

DeepSeek开源第四弹来了!梁文锋参与研发
DeepSeek开源第四弹来了!梁文锋参与研发
发表于:2025-02-27 浏览:22 发布者: 网易互联网
外媒关注:库克造访DeepSee发源地杭州
外媒关注:库克造访DeepSee发源地杭州
发表于:2025-03-27 浏览:23 发布者: 网易IT
中国(南昌)虚拟现实产业创新大会召开 四大主
中国(南昌)虚拟现实产业创新大会召开 四大主
发表于:2024-12-19 浏览:51 发布者: 网易科技
快手成立14周年给员工发放司庆红包,最高888元
快手成立14周年给员工发放司庆红包,最高888元
发表于:2025-06-06 浏览:12 发布者: 网易互联网
小红书推出评论区挂链功能,电商闭环更进一步
小红书推出评论区挂链功能,电商闭环更进一步
发表于:2025-04-09 浏览:17 发布者: 网易互联网
中国西促会副会长孙启明:拼多多式物流创新激活
中国西促会副会长孙启明:拼多多式物流创新激活
发表于:2024-11-04 浏览:33 发布者: 网易互联网
全球首个Linux开发本:50TOPS算力,DeepSeek已
全球首个Linux开发本:50TOPS算力,DeepSeek已
发表于:2025-04-11 浏览:21 发布者: 网易互联网
7月21日外媒科学网站摘要:颠覆认知!生男生女
7月21日外媒科学网站摘要:颠覆认知!生男生女
发表于:2025-07-21 浏览:4 发布者: 网易科技
点开视频App直接干到双十一 摇一摇侵权了吗?
点开视频App直接干到双十一 摇一摇侵权了吗?
发表于:2024-11-12 浏览:53 发布者: 网易互联网
苹果喊话iPhone 13/14钉子户:等等党们是时候换16 Pro了
苹果喊话iPhone 13/14钉子户:等等党们是时候换16 Pro了
发表于:2024-11-07 浏览:50 发布者: 网易新闻