您的当前位置:首页>科技咨询>资讯详情

DeepSeek更新了

发表于:2025-05-29 14:00:05 浏览:20次 发布者: 网易互联网

5月28日,DeepSeek在官方交流群中公布,DeepSeek R1模型已完成小版本试升级。用户可在官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。DeepSeek在开源社区Hugging Face也开源了新版R1模型(R1-0528)。


有网友对新版R1模型进行了测试,并表示Deepseek-R1-0528在竞赛级编程的难度基准LiveCodeBench中的表现几乎与OpenAI的o3模型相当。


社交网络和信息网站City-data.com创始人Lech Mazur在社交媒体上表示,Deepseek-R1-0528在Extended NYT Connections基准测试中比原先的DeepSeek R1有了显著改进,分数从38.6上升到49.8。在Thematic Generation基准测试中,Deepseek-R1-0528也优于DeepSeek R1,分数从1.80变为1.74,该分数越低越好。Thematic Generation基准测试衡量各种大模型如何有效地从一小组示例和反示例推断出一个狭窄或特定的“主题”(类别/规则),然后在一组具有误导性的候选项中检测出哪一项真正符合该主题。


DeepSeek今年春节期间大火。3月份,DeepSeek V3模型完成小版本升级。新版V3模型借鉴DeepSeek R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。在中文写作任务方面,新版V3模型基于R1的写作水平进行优化,同时提升中长篇文本创作的内容质量。

猜你喜欢

虎嗅【作·嗅之星】周榜第273期
虎嗅【作·嗅之星】周榜第273期
发表于:2025-08-05 浏览:13 发布者: 网易互联网
以“三个向善”构建直播电商善意长河,促进行业
以“三个向善”构建直播电商善意长河,促进行业
发表于:2025-06-13 浏览:20 发布者: 网易互联网
驿站之争,下沉有战事
驿站之争,下沉有战事
发表于:2025-05-13 浏览:23 发布者: 网易互联网
iPhone 16 Pro变飞船上太空!网友吐槽苹果最新广告:看的尴尬症犯了
iPhone 16 Pro变飞船上太空!网友吐槽苹果最新广告:看的尴尬症犯了
发表于:2024-11-07 浏览:78 发布者: 快科技官方
早资道|雷军:小米SU7 12月交付量超特斯拉Mode
早资道|雷军:小米SU7 12月交付量超特斯拉Mode
发表于:2025-01-22 浏览:40 发布者: 网易互联网
Rokid Glasses AR 眼镜升级:搭载多款 AI 大模
Rokid Glasses AR 眼镜升级:搭载多款 AI 大模
发表于:2025-03-10 浏览:27 发布者: 网易科技
罗永浩数字人直播带货了,开播26分钟超真人直播
罗永浩数字人直播带货了,开播26分钟超真人直播
发表于:2025-06-15 浏览:18 发布者: 网易互联网
7月9日外媒科学网站摘要:《自然》文章揭示压力
7月9日外媒科学网站摘要:《自然》文章揭示压力
发表于:2025-07-09 浏览:20 发布者: 网易科技
Perplexity CEO表示或将利用Kimi K2进行后训练
Perplexity CEO表示或将利用Kimi K2进行后训练
发表于:2025-07-13 浏览:15 发布者: 网易互联网
1秒钟生成3D模型!腾讯混元甩出5款开源3D模型
1秒钟生成3D模型!腾讯混元甩出5款开源3D模型
发表于:2025-03-19 浏览:27 发布者: 网易互联网