您的当前位置:首页>科技咨询>资讯详情

DeepSeek-R1更新,官方说明来了!多项表现已接

发表于:2025-05-29 23:00:07 浏览:8次 发布者: 网易互联网

5月29日晚间,深度求索微信公众号公布了 DeepSeek-R1-0528 更新的详细升级内容,DeepSeek-R1-0528 仍然使用 2024年12月所发布的 DeepSeek V3 Base 模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。更新后的 R1 模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。


图片来源:视觉中国

其他能力更新比如:

1.幻觉改善:新版 DeepSeek R1 针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45~50% 左右,能够有效地提供更为准确、可靠的结果。

2.创意写作:在旧版 R1 的基础上,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

3.工具调用:DeepSeek-R1-0528 支持工具调用(不支持在 thinking 中进行工具调用)。当前模型 Tau-Bench 测评成绩为 airline 53.5% / retail 63.9%,与 OpenAI o1-high 相当,但与 o3-High 以及 Claude 4 Sonnet 仍有差距。

5月29日凌晨,DeepSeek-R1-0528正式在Hugging Face平台开源。此前一日(5月28日),DeepSeek官方宣布DeepSeek-R1模型已完成小版本试升级,用户可通过官方网页、App、小程序进行测试(打开深度思考),API接口和使用方式保持不变。


每日经济新闻综合公开消息

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

猜你喜欢

阿维塔12双动力上市 共计六款车型售价26.99万元起
阿维塔12双动力上市 共计六款车型售价26.99万元起
发表于:2024-11-03 浏览:40 发布者: CNMO
李彦宏:今年是萝卜快跑扩张之年,将寻求合作方
李彦宏:今年是萝卜快跑扩张之年,将寻求合作方
发表于:2025-02-19 浏览:19 发布者: 网易互联网
七大SaaS巨头财报揭秘 洞察全球SaaS行业最新趋势
七大SaaS巨头财报揭秘 洞察全球SaaS行业最新趋势
发表于:2024-11-09 浏览:58 发布者: 数据猿
现场直击央视315点名企业飞鸽传书,记者现场发
现场直击央视315点名企业飞鸽传书,记者现场发
发表于:2025-03-16 浏览:15 发布者: 网易互联网
方程豹豹8正式上市 搭载华为智驾ADS 3.0 售37.98万起
方程豹豹8正式上市 搭载华为智驾ADS 3.0 售37.98万起
发表于:2024-11-14 浏览:43 发布者: CNMO
TechWeb微晚报:特斯拉Model Y限时降价,哪吒汽车10亿股权被冻结?
TechWeb微晚报:特斯拉Model Y限时降价,哪吒汽车10亿股权被冻结?
发表于:2024-11-26 浏览:52 发布者: TechWeb
Meta恢复在欧盟使用用户公开数据训练 AI 模型,
Meta恢复在欧盟使用用户公开数据训练 AI 模型,
发表于:2025-04-15 浏览:14 发布者: 网易科技
Meta(META.US)豪掷8亿美元遭拒 韩国芯片黑马Fur
Meta(META.US)豪掷8亿美元遭拒 韩国芯片黑马Fur
发表于:2025-03-24 浏览:12 发布者: 网易科技
电商平台转舵,阿里京东们争当“三好学生”
电商平台转舵,阿里京东们争当“三好学生”
发表于:2025-02-22 浏览:19 发布者: 网易互联网
降本增效许久的腾讯,正为AI豪掷千金
发表于:2025-05-15 浏览:6 发布者: 网易互联网