您的当前位置:首页>科技咨询>资讯详情

文心大模型X1代码、数学、推理能力超越最新版De

发表于:2025-03-26 23:00:05 浏览:14次 发布者: 网易互联网

来源:环球网

今日,据媒体报道,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。

在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,HumanEval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-Eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。


近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。(古雨)

猜你喜欢

DeepSeek今日连开3源!针对优化的并行策略,梁
DeepSeek今日连开3源!针对优化的并行策略,梁
发表于:2025-02-27 浏览:20 发布者: 网易互联网
独家|B站小店上线,闯出电商新天地?
独家|B站小店上线,闯出电商新天地?
发表于:2025-01-22 浏览:23 发布者: 网易互联网
三只羊风波之后:有人炒作复播,有人晒 “退一赔三”到账截屏
三只羊风波之后:有人炒作复播,有人晒 “退一赔三”到账截屏
发表于:2024-10-29 浏览:42 发布者: 市场资讯
扎克伯格如何实现Meta的硬件野心
扎克伯格如何实现Meta的硬件野心
发表于:2024-12-20 浏览:22 发布者: 网易科技
小米 SU7 Ultra 量产版搭载赛道版高功率电池包
小米 SU7 Ultra 量产版搭载赛道版高功率电池包
发表于:2024-11-03 浏览:37 发布者: 环球网
“小红书封号”登上热搜,该平台近日已处置“黑
“小红书封号”登上热搜,该平台近日已处置“黑
发表于:2024-12-20 浏览:30 发布者: 网易互联网
京东外卖,鲶鱼进场
京东外卖,鲶鱼进场
发表于:2025-02-24 浏览:16 发布者: 网易互联网
反向海淘,一种很新的“出海”
反向海淘,一种很新的“出海”
发表于:2024-12-27 浏览:17 发布者: 网易互联网
阿里发布Qwen3
阿里发布Qwen3
发表于:2025-04-29 浏览:10 发布者: 网易互联网
美国iOS应用商店电商应用榜单前三均为中国APP
美国iOS应用商店电商应用榜单前三均为中国APP
发表于:2025-04-16 浏览:12 发布者: 网易互联网