您的当前位置:首页>科技咨询>资讯详情

阶跃星辰推理模型Step R-mini上线!

发表于:2025-01-16 19:00:07 浏览:28次 发布者: 网易互联网

1月16日消息,阶跃星辰自研推理模型 Step Reasoner mini 上线(简称“Step R-mini”),已经在跃问网页端全量开放。目前,阶跃星辰自研的 Step 系列基座模型矩阵,已经覆盖了从语言、多模态到推理的全面能力。

据了解,Step Reasoner mini 是阶跃星辰 Step 系列基座模型中的首个推理模型,擅长主动进行规划、尝试和反思,能通过慢思考和反复验证的逻辑机制,为用户提供准确可靠的回复。值得关注的是,这款模型既擅长通过超长推理能力,解决逻辑推理、代码和数学等复杂问题,也能兼顾文学创作等通用领域。


在 AIME 和 Math 等数学基准测试上,Step Reasoner mini 的成绩超过了 o1-preview,比肩 OpenAI o1-mini。在LiveCodeBench 代码任务上,也比o1-preview 效果更佳。

除了 Step Reasoner mini 以外,阶跃星辰透露也在打造视觉推理模型。这款模型针对复杂视觉场景下的 Reasoning 问题,引入了慢感知和空间推理的思想,把 Test-Time Scaling 从文本空间转移到视觉空间,实现在视觉空间下的 Spatial-Slow-Thinking,预计将于今年上线。

猜你喜欢

新消费日报 | 特斯拉客服回应在华软件更新;抖
新消费日报 | 特斯拉客服回应在华软件更新;抖
发表于:2025-02-26 浏览:17 发布者: 网易互联网
菜鸟加速全球网络布局,创新科技驱动国际物流服
菜鸟加速全球网络布局,创新科技驱动国际物流服
发表于:2025-03-24 浏览:16 发布者: 网易互联网
美团无人机上新“五线齐飞” 探索多商圈配送联
美团无人机上新“五线齐飞” 探索多商圈配送联
发表于:2024-12-18 浏览:33 发布者: 网易互联网
OpenAI上新,ChatGPT可以视频聊天了
OpenAI上新,ChatGPT可以视频聊天了
发表于:2024-12-18 浏览:35 发布者: 网易IT
文本图格式大一统!首个大规模文本边基准TEG-DB
文本图格式大一统!首个大规模文本边基准TEG-DB
发表于:2024-11-08 浏览:66 发布者: 网易互联网
蚂蚁集团亮相乌镇峰会分享数字公益实践,彭翼捷:一心两力很重要
蚂蚁集团亮相乌镇峰会分享数字公益实践,彭翼捷:一心两力很重要
发表于:2024-11-23 浏览:39 发布者: 新京报
美团闪购剑指京东
美团闪购剑指京东
发表于:2025-04-15 浏览:12 发布者: 网易互联网
阿里巴巴成交额超400亿港元
阿里巴巴成交额超400亿港元
发表于:2025-02-21 浏览:18 发布者: 网易互联网
ControlNet作者再封神!6GB显存直出「兔八哥」
ControlNet作者再封神!6GB显存直出「兔八哥」
发表于:2025-04-18 浏览:13 发布者: 网易互联网
腾讯AI To C产品大变阵:QQ浏览器、搜狗输入法
腾讯AI To C产品大变阵:QQ浏览器、搜狗输入法
发表于:2025-02-19 浏览:22 发布者: 网易互联网