您的当前位置:首页>科技咨询>资讯详情

最新一期权威大模型榜单:豆包1.5、商汤日日新V

发表于:2025-05-30 18:00:22 浏览:12次 发布者: 网易互联网

5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月报告》全新出炉!

豆包1.5·深度思考模型(Doubao-1.5-thinking-pro)和商汤日日新 V6多模态模型(SenseNova-V6 Reasoner)共同摘得金牌,超越Gemini 2.5 Flash Preview,在国内大模型第一梯队领跑。

位居第二梯队的大模型包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1以及DeepSeek-V3。



来自SuperCLUE

报告指出,国内外第一梯队大模型在中文领域的通用能力差距正在缩小。在国产大模型中,
Doubao-1.5-thinking-pro-205415、SenseNova V6 Reasoner表现最为亮眼。国内推理模型竞争格局初露端倪。

SuperCLUE是行业权威的通用大模型的综合性测评基准。本次2025年5月报告聚焦通用能力测评,涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本理解与创作六大任务,总量为1579道多轮简答题。

猜你喜欢

淘宝启动AI假图治理 严厉打击欺骗消费者等违规
淘宝启动AI假图治理 严厉打击欺骗消费者等违规
发表于:2025-03-27 浏览:15 发布者: 网易互联网
三季度中国市场TWS厂商排名出炉:华为大涨 苹果第三
三季度中国市场TWS厂商排名出炉:华为大涨 苹果第三
发表于:2024-11-28 浏览:39 发布者: CNMO
“图书直播”成常态 流量如何变“留量”?
“图书直播”成常态 流量如何变“留量”?
发表于:2025-01-16 浏览:33 发布者: 网易互联网
双十一还没火,快递先打起来了
双十一还没火,快递先打起来了
发表于:2024-10-31 浏览:35 发布者: 网易互联网
受AI冲击,网文译者转型校对,收入缩水近半
受AI冲击,网文译者转型校对,收入缩水近半
发表于:2025-02-12 浏览:20 发布者: 网易互联网
UC伯克利华人开源14B「o3-mini」,代码版R1突袭
UC伯克利华人开源14B「o3-mini」,代码版R1突袭
发表于:2025-04-09 浏览:16 发布者: 网易互联网
戴上VR头显走进“封神前传”,感受元宇宙时代下
戴上VR头显走进“封神前传”,感受元宇宙时代下
发表于:2025-01-25 浏览:28 发布者: 网易科技
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:
反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:
发表于:2025-02-17 浏览:25 发布者: 网易互联网
雷军告诉何小鹏:小鹏汽车最大的问题在于你
雷军告诉何小鹏:小鹏汽车最大的问题在于你
发表于:2024-11-26 浏览:39 发布者: 环球网
2025天猫618更简单:官方立减15%起,最高立减50
2025天猫618更简单:官方立减15%起,最高立减50
发表于:2025-05-08 浏览:16 发布者: 网易互联网