您的当前位置:首页>科技咨询>资讯详情

GPT5发布,槽点竟多过亮点:AGI没来,AI公司肉

发表于:2025-08-08 11:00:07 浏览:1次 发布者: 网易互联网


作者 | Yoky
邮箱 | yokyliu@pingwest.com

我们至今不知道让奥特曼“瘫倒在椅子上”的是什么力量。


因为人们等待许久的GPT-5发布,至少从大家第一时间对发布会的感受来看,居然是槽点,甚至笑料多过了亮点……

几个月前,甚至发布前,都不会有人想到,这么万众期待的模型发布,被传播最多的会是多张让人哭笑不得的错误图表:


而这几乎就是发布会给人们感受的一个缩影。

大量工作在争夺用户注意力上,不少不错的细节提升,但没有大的惊喜,甚至一度有些好笑,“AGI”还早,肉搏时代开启了。

GPT5来了,模型没有到AGI时刻,甚至连“aha moment”也没有。

正如发布前的剧透,GPT-5采用了“All in one”策略,将推理、编码、语音、研究等能力整合进单一模型,根据用户需求自动调取相应能力。在各个垂直领域,GPT-5都刷新了基准测试成绩,其中编程能力的进化最为显著,无论你是专业的开发者,还是小白尝试vibe Coding,它都在模型能力上做了优化。


API方面,他首次考虑到了广大用户的钱包,开启了一轮大降价。企业用户可以通过自己的预算来调低中高档位,分别为GPT-5标准版、GPT-5-mini版、GPT-5-nano版。其中GPT-5-mini 的价格低于谷歌的 Gemini 2.5 Flash,而 GPT-5 Standard 的价格仅为 Claude 4 Opus 的十二分之一。


新模型的案例演示、再次被刷新的Benchmark、被打下来的API价格,几乎构成了这场发布会的全部。但不同的是,在最后三分一,OpenAI加入了一些并不那么炫酷的企业案例分享,展示了他们如何通过模型帮助企业构建自己的应用,同时增加了一个专门服务于企业的模型 GPT-5-chat:面向客服场景,延迟 <200 ms。

而这些,才是GPT-5发布的真正意图:他们想要的已经不是技术Demo的掌声,而是企业客户的真金白银。GPT-5不是代际跨越的炸裂模型,而是OpenAI准备投入到商业肉搏的底牌。

结合Sam Altman此前在X上关于SaaS的预判,一旦企业能够基于GPT-5自主构建应用,传统SaaS模式确实面临冲击。


但这也证明了一个更深层的现实:整个AI行业都已从技术炫技转向商业落地的关键阶段,连OpenAI也不例外。

1

一个模型,多种智能

发布的开始,Sam Altman就代表OpenAI ,认为这不是一次简单的升级,而是一次智能的「次元跳跃」。


官方宣称它引入了一个全新的「智能路由」系统,能秒级判断你的问题难度,自动调用合适的「大脑」来回答。普通问题用「高效大脑」快速响应,复杂问题则自动切换到「深度思考大脑」。这种快思考和慢思考的结合,在今年更早的时候,已经有部分模型产品通过Autothink已经实现。

GPT-5 首次把 GPT 系列与 o 系列推理模型融合,形成单一多模态架构。上下文窗口扩展至 1 M tokens,输出可达 10 万 tokens,支持 MCP(模型上下文协议)与并行工具调用。四个变体全部面向代码场景优化:

• gpt-5:旗舰,长链推理 + 全模态;

• gpt-5-mini:成本↓60%,保留 90 % 编程性能;

• gpt-5-nano:端侧离线 32 K,延迟 <40 ms;

• gpt-5-chat:企业级对话,CI/CD 集成插件化。

针对不同的场景,GPT-5都做了单项优化,比如写作中的语感优化、语音对话功能多语种灵活切换能力,GPT-5 也在新的 ARC-AGI-2 上进行了测试。除 Grok 4(思考)外,它的表现优于所有主要模型。


但最可圈可点的,是在整个Coding能力上再次提高了一个水准。代码能力覆盖了两种场景,一种是低提示词的非专业用户场景,

在发布会上,OpenAI 的后期训练负责人 Yann Dubois 使用 GPT-5 现场演示,要求它生成一个用于学习法语、并带有互动游戏的网站。在短短几秒钟内,GPT-5 就编写了数百行代码,并直接展示了网站的前端界面。他在 Zoom 上分享屏幕并进行了简单的点击操作,一个看起来非常酷炫的网站便生成了。


在 Canvas 中,GPT-5 可以快速一次性完成前端应用程序,以保证没有免费又好用的编码模型的用户,能够实现真正的Vibe Coding。

在专业编程场景,GPT-5 支持一键上传整个前后端仓库,秒级生成可视化“代码地图”,分层展示模块依赖、性能瓶颈及安全漏洞,并给出优先级列表;针对遗留代码,它能自动剔除无用依赖、统一命名风格、补全类型注解,同时生成 Git 回滚脚本,确保重构零风险。

同时模型原生支持 Python、TypeScript、Rust、Go、Solidity 等 20 余种语言混合项目,可智能识别跨语言调用链,自动生成 FFI 绑定、序列化代码及对应的 Docker 多阶段构建文件,无需人工干预即可打通开发与部署全链路。

当然,尽管OpenAI一直在强调“GPT-5是世界上最好的编程模型”,但在 OpenAI 的展示中,却出现了Benchmark图的坐标轴“作弊”的行为,不仅有 52.8 > 69.1 这样的弱智错误,也实际上夸大了 GPT-5 的能力提升。



抛开一些“小插曲”,GPT-5 的确把“写代码”升级为“交付软件”,从单文件补全到跨语言、跨框架、端到端的工程代理。开发者获得的不仅是更快的自动补全,而是一键可部署、可测试、可维护的工程团队。

为了尽可能的保证模型的可用性,OpenAI花了不少时间用来降低模型幻觉。模型安全研究负责人 Alex Beutel 透露,OpenAI 为评估 GPT-5 的潜在风险,累计投入逾五千小时进行深度测试,核心目标之一是杜绝模型向用户“撒谎”。

尽管相比 o3 推理模型,GPT-5 的幻觉有所收敛,但“言之凿凿的假话”仍是大型语言模型难以根除的顽疾;尤其在模型扮演智能体、执行多步骤任务时,这一隐患会被进一步放大。 不过,OpenAI 强调,GPT-5 在连贯完成复杂流程方面更值得信赖。Beutel 指出,过去曾出现模型宣称已达成目标却实际未行动的情况,如今团队正着力堵住此类漏洞。

整体来说,GPT-5在模型、产品、场景进行了综合的优化提升,它可能不是某一个领域绝对的尖子生,但却是全能的ACE。

1

用低价突围商业化

“卷价格”常常被形容是中国大模型厂商们的做法,而这次OpenAI告诉大家,你们错了,我卷起来更狠。

面向个人用户,OpenAI采取了免费先用、分级限速的策略。从今天起,所有 ChatGPT 账号都能直接体验 GPT-5,无需排队。免费层每天有一定额度,用完即自动降级到 GPT-5-mini 继续对话。Plus 会员额度翻倍,Pro 会员则可调用“GPT-5 Pro”这一高推理档位。换句话说,OpenAI 把 7 亿 C 端用户当成了「默认入口」,但真正的算盘并不在这里。

面向企业客户则出现了明显的低价抢市场。根据官网消息,标准版 GPT-5:输入 1.25 美元 / 百万 token,输出 10 美元 / 百万 token,比 GPT-4 时代普遍低 30–50%。mini 与 nano 再砍一刀,分别低至 0.3 美元和 0.05 美元 / 百万 token,几乎逼近自托管成本。


企业套餐还附带零保留、私有端点、并发翻倍,整体算下来,同等算力支出可节省 40% 以上。

显然,OpenAI 这次把火力瞄准了 B 端:用超低 API 价格把企业从自研或竞争对手那里直接“挖”过来,C 端免费只是流量入口和口碑放大器。


显然,新的价格让这些“苦o3久矣”的开发者们十分满意,当GPT-5标准版仅为Claude 4 Opus十二分之一价格时,那些靠“性价比”立足的平替厂商将面临生存危机。

参考国内上一轮的模型“价格战”,基础模型市场将迎来残酷的优胜劣汰。中小模型厂商要么在垂直领域找到差异化定位,要么被迫退出竞争。

当然,推理成本的大幅下降直接降低了AI应用的准入门槛。当调用成本不再是制约因素,更多企业和开发者将尝试将AI能力集成到产品中。软件的边际成本持续降低,将催生新一轮应用创新浪潮,从工具类应用到消费级产品都将受益。

从技术突破到价格屠夫,从能力炫技到场景落地,OpenAI这次发布的核心逻辑异常清晰:用成本优势和产品整合来重塑整个AI生态的游戏规则。

当GPT-5以白菜价提供接近人类专家水平的能力时,它实际上是在向整个行业宣战——不仅要抢夺竞对的市场份额,更要让传统软件服务商感受到降维打击的压力。这种策略转变标志着AI行业从“技术驱动”正式迈入“商业驱动”阶段。


GPT-5不是技术的终点,而是商业肉搏战更进一步的信号。接下来,像是Meta离谱高价抢夺人才,OpenAI发布会的“图表错误”,Anthropic断供二选一之类的事情,会比让人惊叹的模型大跃升和各种“Aha moment ”更多的出现在你面前。


点个爱心,再走 吧

猜你喜欢

厚植电子商务营商环境法治土壤
厚植电子商务营商环境法治土壤
发表于:2024-11-07 浏览:44 发布者: 网易互联网
中厂不折腾
中厂不折腾
发表于:2025-05-21 浏览:12 发布者: 网易互联网
中国又一款应用在美国爆火,下载量涨幅超过900%
中国又一款应用在美国爆火,下载量涨幅超过900%
发表于:2025-04-15 浏览:21 发布者: 网易互联网
进击双11丨兴趣技能、生活服务开辟第二职场,首
进击双11丨兴趣技能、生活服务开辟第二职场,首
发表于:2024-11-04 浏览:44 发布者: 网易互联网
微软宣布对欧五项数字承诺,计划两年内将欧洲数
微软宣布对欧五项数字承诺,计划两年内将欧洲数
发表于:2025-04-30 浏览:25 发布者: 网易互联网
阿里云成为世界泳联全球独家云服务商
阿里云成为世界泳联全球独家云服务商
发表于:2025-07-30 浏览:6 发布者: 网易互联网
叮咚买菜,另辟蹊径
叮咚买菜,另辟蹊径
发表于:2025-07-23 浏览:7 发布者: 网易互联网
转人工客服怎么这么难?
转人工客服怎么这么难?
发表于:2025-06-10 浏览:14 发布者: 网易互联网
河南潢川优化互联网营商环境 维护消费者合法权
河南潢川优化互联网营商环境 维护消费者合法权
发表于:2025-03-06 浏览:26 发布者: 网易互联网
将“首发”思维注入跨境电商 在创新中锻造全球
将“首发”思维注入跨境电商 在创新中锻造全球
发表于:2025-03-05 浏览:32 发布者: 网易互联网