新智元报道
新智元报道
【新智元导读】直播事故、网友吐槽、专家唱衰……GPT-5登场第一天就遭遇口碑滑铁卢。有人说这是AI泡沫破裂的前兆,也有人预言「第二个AI寒冬」或将来临。但奥特曼在近日接受Wired采访时不认输,认为这是一次被误解的跃迁。真相究竟如何?
一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发
GPT-5的发布不算体面。
发布会直播中,演示图表数据绘制错误导致严重误导,被观众抓包;
网友直接在发布会视频下面锐评并被点赞到第一位:「看吧,这肯定是用GPT-5做的PPT。」
Reddit上用户吐槽,「更不灵光」「没了GPT-4o的温柔」;
AI专家Gary Marcus更是在多个平台「庆功」,直言这款史上最被吹捧的AI模型没达标,AGI和「博士级认知」连边都没碰到。
质疑声席卷而来,一些人甚至喊出「AI第二次寒冬要来了」。
但OpenAI显然不这么认为。
奥特曼事后接受采访时坦言:「确实,发布当天的氛围不太妙。」
不过他说,这不是模型能力的问题,而是节奏错了,期待错位了。
换句话说,GPT-5不是不行,而是大家看它的角度出了偏差。
要理解这点,得先搞清楚一个问题:GPT-5到底进化了什么?
OpenAI的解释是——这一代的提升主要集中在科研、数学、代码等高阶领域。
奥特曼举了个例子:有物理学家说GPT-5帮他解开了研究瓶颈;生物学家惊叹它在某个难题上「想得出奇」。
可问题是,这些例子没人实名,也不是每个人都用得上。
正如奥特曼自己也承认:「大多数人不是物理研究员。」
于是,「进步」变得不明显,甚至成了「退步」。
再看几个更具体的细节:
在数学能力上,GPT-5已经可以跻身「国际数学奥赛前五名」——而GPT-4还在「Top 200」徘徊(刚刚,OpenAI神秘新模型斩获IMO 2025金牌!攻克奥数巅峰,硅谷沸腾);
在代码推理方面,GPT-5能更准确地识别多步逻辑错误,甚至可以做部分单元测试的自动化;
它更擅长写论文摘要、提出科学假设,部分实验室已开始小规模应用。
这些变化,普通用户几乎感受不到。也正因此,它被误会成了「换皮产品」。
过去几年,OpenAI的策略是「投喂更多数据 + 更大模型 + 更强算力」,一条路走到底。
但到了GPT-5,事情变了。
这一代模型的能力,不是靠数据量或算力暴力增长堆出来的。
核心升级源自:基于人类反馈的强化学习(RLHF)。
简单说,就是找来一批专家,对模型输出进行评估、打分、反馈,再反复训练它「像专家一样思考」。
更有意思的是:现在的模型已经可以「喂自己吃东西」了。
Greg Brockman称,当模型不够聪明时,只能靠大模型训练;但一旦它有足够的判断力,就可以从自己的输出中筛选优质内容,再回过头来教自己。
这个逻辑叫「自采样」(sampling from itself),是AI走向自我优化的关键节点。
这场技术转向带来了很大的变化:
它更擅长处理复杂推理链条;
对幻觉和错误率的控制更严格;
在专业场景的适应性更强。
GPT变得更像一个满嘴术语的专家了,但或许也和普通人之间交流的隔阂变深了。
面对「规模化路线失败」的批评,OpenAI并不认同。
虽然GPT-5并不是靠「多10倍显卡」训练出来的,但他们并没有停止投资基础设施。
相反,奥特曼明确表示:我们依然相信规模,但现在的难度是物理级的。
以他们正在德州阿比林(Abilene, Texas)建设的数据中心为例,预算高达数百亿美元。
Greg Brockman形容,这种规模的基建,「就像做一台2倍大的火箭——难度是10倍以上」。
原因显而易见:下一代模型的突破,不仅需要更聪明的训练策略,还要更大算力支撑,而现在的全球芯片与电力资源远远跟不上。
也就是说,强化学习是「当下最优解」,但真正把AI推向AGI级别,还是得靠规模发力。
奥特曼过去几年的演讲里,AGI一直被描述为终极目标:「当AI能完成大多数人类有价值的工作,我们就完成了使命。」
但最近,他换了说法。
现在的OpenAI认为:AGI不是终点站,而是一段旅程。
或者说,它是一个「指数式增长的过程」,而非某个模型突然变得「全能」。
这种转向有两个好处:
再也不需要设定一个「AGI发布日期」来背负压力;
更适合以「科学进展速度」为衡量标准,而不是单次能力跃迁。
奥特曼的新定义里,AGI的核心是能参与推动基础科研进步,比如物理理论、化学实验、药物筛选。
正因如此,你会看到OpenAI内部正在「品牌化」这个模糊概念:
员工笔电上贴着「FEEL THE AGI」;
总部一楼有卖同款T恤;
办公区墙上贴满「AI青春期」的解释图——指的是AI从「只会模仿」走向「有点意识」的尴尬阶段。
OpenAI眼中的GPT-5,就是AGI的青春期。
GPT-5的争议,其实是一场「叙事落差」:
公众盼望的是「AI通关」,而OpenAI现在给的是「能力曲线」。
模型升级的路线,已经从「炫技」转向「内功」。
奥特曼说,GPT-6会更好,GPT-7会更惊人。
但真正值得期待的,是你手里的模型,能不能今天就帮你少错一步、多做一点。
<br>
<a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652632304&idx=2&sn=497e7e671d948aeed922e7d3daab82bf&chksm=f025acee86dec820f1adec5ba25f0e714d8309bd00deecbe23e9d6a451851707db903b0b2f1f&scene=0#rd" target="_blank">文章原文</a>
<br>
<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/isQfncB1oL&maxage=1y" width="1px"></div></div></body></html>