您的当前位置:首页>科技咨询>资讯详情

文心大模型X1代码、数学、推理能力超越最新版De

发表于:2025-03-26 23:00:05 浏览:26次 发布者: 网易互联网

来源:环球网

今日,据媒体报道,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。

在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,HumanEval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-Eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。


近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。(古雨)

猜你喜欢

消息称微软将砍掉 Xbox 游戏机
消息称微软将砍掉 Xbox 游戏机
发表于:2025-05-25 浏览:12 发布者: 网易科技
iPhone在全球都实现了增长!苹果上财季营收增6%,在中国市场降幅收窄
iPhone在全球都实现了增长!苹果上财季营收增6%,在中国市场降幅收窄
发表于:2024-11-01 浏览:50 发布者: 澎湃新闻
小米NAS来了!核心技术已预研:将支持手机扩容 资源下载
小米NAS来了!核心技术已预研:将支持手机扩容 资源下载
发表于:2024-11-01 浏览:43 发布者: 快科技官方
京东该上线自营外卖了
京东该上线自营外卖了
发表于:2025-07-11 浏览:8 发布者: 网易互联网
饿了么:2023年已启动蓝骑士社保缴纳试点
饿了么:2023年已启动蓝骑士社保缴纳试点
发表于:2025-02-20 浏览:24 发布者: 网易互联网
小米辅助驾驶再迎大将 前一汽南京CTO陈光加入
小米辅助驾驶再迎大将 前一汽南京CTO陈光加入
发表于:2025-05-30 浏览:14 发布者: 网易互联网
零一万物发布“超级员工”企业智能体
零一万物发布“超级员工”企业智能体
发表于:2025-07-22 浏览:6 发布者: 网易互联网
快递业务量井喷,智能快递柜是否“失宠”?
快递业务量井喷,智能快递柜是否“失宠”?
发表于:2024-11-08 浏览:41 发布者: 网易互联网
腾讯科技申请赛事直播画面的呈现方法专利,提供
腾讯科技申请赛事直播画面的呈现方法专利,提供
发表于:2025-01-31 浏览:31 发布者: 网易科技
几百万本书白给AI训练?Meta胜诉AI版权案,美国
几百万本书白给AI训练?Meta胜诉AI版权案,美国
发表于:2025-06-29 浏览:8 发布者: 网易科技