您的当前位置:首页>科技咨询>资讯详情

DeepSeek-R1-0528更新官方详解:思考更深、推理

发表于:2025-05-29 23:00:06 浏览:12次 发布者: 网易互联网

智通财经APP获悉,今日晚间,深度求索官方公布了 DeepSeek-R1-0528 更新的详细升级内容。DeepSeek-R1-0528仍然使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。更新后的 R1 模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。


DeepSeek-R1-0528 在各项评测集上均取得了优异表现。相较于旧版 R1,新版模型在复杂推理任务中的表现有了显著提升。例如在 AIME 2025 测试中,新版模型准确率由旧版的 70% 提升至 87.5%。

这一进步得益于模型在推理过程中的思维深度增强:在 AIME 2025 测试集上,旧版模型平均每题使用 12K tokens,而新版模型平均每题使用 23K tokens,表明其在解题过程中进行了更为详尽和深入的思考。

此外,新版 DeepSeek R1 针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45~50% 左右,能够有效地提供更为准确、可靠的结果。在旧版 R1 的基础上,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

猜你喜欢

华为昇腾+DeepSeek来了!
华为昇腾+DeepSeek来了!
发表于:2025-02-05 浏览:29 发布者: 网易互联网
京东加速出海,拓展欧洲线上零售,在伦敦地区试
京东加速出海,拓展欧洲线上零售,在伦敦地区试
发表于:2025-04-09 浏览:14 发布者: 网易互联网
可以升级了!微软解决Win11 24H2应用不兼容蓝屏问题
可以升级了!微软解决Win11 24H2应用不兼容蓝屏问题
发表于:2024-11-11 浏览:52 发布者: 网易新闻
突发|动荡72小时后,华人团队Cognition收购Win
突发|动荡72小时后,华人团队Cognition收购Win
发表于:2025-07-15 浏览:9 发布者: 网易互联网
关税冲击下的跨境电商丨杜国臣:跨境电商应以供
关税冲击下的跨境电商丨杜国臣:跨境电商应以供
发表于:2025-04-25 浏览:15 发布者: 网易互联网
微信又有新功能!网友:这挺好
微信又有新功能!网友:这挺好
发表于:2024-12-24 浏览:56 发布者: 网易互联网
2025商业新愿景|美腕创始人戚振波:以品质直播
2025商业新愿景|美腕创始人戚振波:以品质直播
发表于:2025-01-23 浏览:26 发布者: 网易互联网
在拼多多,看到新需求、新产品、新商家
在拼多多,看到新需求、新产品、新商家
发表于:2025-01-17 浏览:28 发布者: 网易互联网
服务电商终于要起风了!啄木鸟遭315点名,京东
服务电商终于要起风了!啄木鸟遭315点名,京东
发表于:2025-03-18 浏览:22 发布者: 网易互联网
高管当庭放话:除了谷歌,没人玩得转Chrome浏览
高管当庭放话:除了谷歌,没人玩得转Chrome浏览
发表于:2025-04-27 浏览:15 发布者: 网易IT