您的当前位置:首页>科技咨询>资讯详情

DeepSeek-R1更新,官方说明来了!多项表现已接

发表于:2025-05-29 23:00:07 浏览:15次 发布者: 网易互联网

5月29日晚间,深度求索微信公众号公布了 DeepSeek-R1-0528 更新的详细升级内容,DeepSeek-R1-0528 仍然使用 2024年12月所发布的 DeepSeek V3 Base 模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。更新后的 R1 模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。


图片来源:视觉中国

其他能力更新比如:

1.幻觉改善:新版 DeepSeek R1 针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45~50% 左右,能够有效地提供更为准确、可靠的结果。

2.创意写作:在旧版 R1 的基础上,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

3.工具调用:DeepSeek-R1-0528 支持工具调用(不支持在 thinking 中进行工具调用)。当前模型 Tau-Bench 测评成绩为 airline 53.5% / retail 63.9%,与 OpenAI o1-high 相当,但与 o3-High 以及 Claude 4 Sonnet 仍有差距。

5月29日凌晨,DeepSeek-R1-0528正式在Hugging Face平台开源。此前一日(5月28日),DeepSeek官方宣布DeepSeek-R1模型已完成小版本试升级,用户可通过官方网页、App、小程序进行测试(打开深度思考),API接口和使用方式保持不变。


每日经济新闻综合公开消息

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

猜你喜欢

整治无底线博流量等“自媒体”乱象,上海公布一
整治无底线博流量等“自媒体”乱象,上海公布一
发表于:2025-01-24 浏览:36 发布者: 网易互联网
骑手“二选一”?京东和美团都不能输的一仗→
骑手“二选一”?京东和美团都不能输的一仗→
发表于:2025-04-21 浏览:18 发布者: 网易互联网
Rokid与蓝思科技联合开发的AI+AR眼镜正式量产
Rokid与蓝思科技联合开发的AI+AR眼镜正式量产
发表于:2025-06-24 浏览:7 发布者: 网易科技
淘宝闪购 520升级「鲜花免单」
淘宝闪购 520升级「鲜花免单」
发表于:2025-05-20 浏览:13 发布者: 网易互联网
抖音集团副总裁回应“泽连斯基被封号” :账号
抖音集团副总裁回应“泽连斯基被封号” :账号
发表于:2025-01-09 浏览:29 发布者: 网易互联网
不明链接跳转何时休?中消协发布提醒
不明链接跳转何时休?中消协发布提醒
发表于:2024-11-01 浏览:36 发布者: 网易互联网
小米已有卫生护垫类商标 包含湿巾、卫生护垫、
小米已有卫生护垫类商标 包含湿巾、卫生护垫、
发表于:2025-03-18 浏览:20 发布者: 网易互联网
海螺新模型海外爆火:一夜之间,猫、羊驼、长颈
海螺新模型海外爆火:一夜之间,猫、羊驼、长颈
发表于:2025-06-23 浏览:8 发布者: 网易互联网
视频|宇树机器人“进化”、Meta抛出橄榄枝!机
视频|宇树机器人“进化”、Meta抛出橄榄枝!机
发表于:2025-02-17 浏览:25 发布者: 网易科技
曝光!27款APP侵害用户权益,工信部通报
曝光!27款APP侵害用户权益,工信部通报
发表于:2024-11-27 浏览:39 发布者: 网易互联网