您的当前位置:首页>科技咨询>资讯详情

深夜重磅!全球首个混合推理模型Claude 3.7 Son

发表于:2025-02-25 10:00:14 浏览:25次 发布者: 网易互联网

今日凌晨,Anthropic 突然发布了全球首款混合推理模型、迄今为止最好的编码模型——Claude 3.7 Sonnet。(Claude 4.0 还要再等一等[皱眉])

据官方介绍,Claude 3.7 Sonnet 具有“一个模型,两种思考方式”(One model, two ways to think)的特点,即标准和扩展思考模式。用户可以选择何时让模型正常回答问题,何时让模型思考更长时间再回答问题。

“正如人类使用单个大脑进行快速反应和深度思考一样,我们认为推理应该是前沿模型的一种综合能力,而不是完全独立的模型。这种统一的方法还能为用户带来更完美的体验。”

Claude 3.7 Sonnet 可以生成近乎即时的响应,也可以生成用户可见的扩展、逐步思考的结果,在编码和前端网络开发方面的改进尤为显著。

另外,API 用户还可以对模型的思考时间进行精细控制。例如,用户可以告诉 Claude 思考的时间不超过 N 个 token,无论 N 为多少,其输出限制为 128K 个 token。这允许用户在速度(和成本)和答案质量之间进行权衡。

早期测试表明,Claude 3.7 Sonnet 的编码能力全面领先于其它模型,在处理复杂代码库和高级工具使用等方面都有显著改进。在评估 LLM 解决 GitHub 上真实软件问题能力的基准测试数据集 SWE-bench Verified 上,Claude 3.7 Sonnet 的表现达到了 SOTA。

在评估 LLM 在复杂真实场景中用户与工具交互能力的基准 TAU-bench 上,Claude 3.7 Sonnet 超过了 Claude 3.5 Sonnet 和 OpenAI 的 o1,达到了 SOTA。

除了 Claude 3.7 Sonnet ,Anthropic 还推出了一个用于代理编码的命令行工具——Claude Code,能够使开发人员可以直接从终端将大量工程任务委托给 Claude。

此外,Anthropic 还对外展示了他们的发展图景——2025 年,Claude 成为独立自主工作数小时的专家级智能体;2027 年,Claude 能够解决人工团队花费数年才能解决的挑战性难题[加油]。






猜你喜欢

网络安全行业再起整合风 这次主题围绕AI:Palo
网络安全行业再起整合风 这次主题围绕AI:Palo
发表于:2025-07-22 浏览:3 发布者: 网易互联网
科技巨头谷歌,面临超480亿元诉讼!什么情况?
科技巨头谷歌,面临超480亿元诉讼!什么情况?
发表于:2025-04-17 浏览:16 发布者: 网易互联网
美团无人机试水IP联动 促订单同比大增74%
美团无人机试水IP联动 促订单同比大增74%
发表于:2025-05-05 浏览:13 发布者: 网易互联网
快手一季度营收326亿元,可灵AI收入超过1.5亿元
快手一季度营收326亿元,可灵AI收入超过1.5亿元
发表于:2025-05-27 浏览:14 发布者: 网易互联网
第六届滴滴司机节落地成都 全国四十多名司机代
第六届滴滴司机节落地成都 全国四十多名司机代
发表于:2024-11-27 浏览:47 发布者: 网易互联网
一只羊成就亿元产业,拼多多新质供给如何造就“
一只羊成就亿元产业,拼多多新质供给如何造就“
发表于:2025-05-07 浏览:19 发布者: 网易互联网
“腾讯会议崩了”登上热搜,官方再致歉:目前服
“腾讯会议崩了”登上热搜,官方再致歉:目前服
发表于:2025-04-02 浏览:16 发布者: 网易互联网
“跟票”微信送礼物“红包”?抖音电商:2023年
“跟票”微信送礼物“红包”?抖音电商:2023年
发表于:2024-12-26 浏览:41 发布者: 网易互联网
网购“仅退款” 条款下线,在提振消费的当下是
网购“仅退款” 条款下线,在提振消费的当下是
发表于:2025-04-24 浏览:19 发布者: 网易互联网
TikTok恢复在美服务
TikTok恢复在美服务
发表于:2025-01-20 浏览:34 发布者: 网易互联网