动态列表

  • 刚刚!谷歌内部揭秘Genie 3:Sora后最强AI爆款,开启世界模型新时代
  • 硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码
  • 黄仁勋子女逆袭上位!4万亿「皇储」成长史首曝:一个学烘培,一个开酒吧
  • 400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?
  • CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力
  • SEAgent:开启从实战经验中自我进化的GUI智能体新纪元
  • OpenAI估值达5000亿美元;「原道」联手小岛秀夫,推《死亡搁浅》耳机;苹果手表将「大幅重新设计」
  • 奥特曼神秘晚宴讲话曝出!OpenAI的CEO或将是个AI,Chrome我也想买
  • 谷歌最新「0.27B」Gemma 3开源!身板小却猛如虎,开发者直呼救命稻草
  • 最惨就业季!CS学霸GPA 3.98,投2500份简历仅10次面试,AI吞噬入门级岗位
  • Yann LeCun最新纪录片首曝!传奇AI教父的双面人生,深度学习幕后40年
  • 大模型如何推理?斯坦福CS25重要一课,DeepMind首席科学家主讲
  • 当AI比我们更聪明:李飞飞和Hinton给出截然相反的生存指南
  • 简单即强大:全新生成模型「离散分布网络DDN」是如何做到原理简单,性质独特?
  • Sam Altman:AI存在泡沫;宇树机器人夺金,王兴兴:用遥控追求极致速度;蔡浩宇AI游戏上架,27.19元|极客早知道
  • 吞下17亿图片,Meta最强巨兽DINOv3开源!重新定义CV天花板
  • 打开高德的理由又多一条!全球首个「需求链智能调度」AI地图上线
  • 核心模型被曝蒸馏DeepSeek?前女友一纸控诉,曝出欧版OpenAI塌房真相!
  • 一句话搞定多任务出行,高德用空间智能重新定义地图
  • GPT-5、Grok 4、o3 Pro都零分,史上最难AI评测基准换它了
  • 谷歌开源Gemma 3 270M,性能超越Qwen 2.5同级模型
  • 追剧不断网,可能背后有个AI在加班,故障诊断准度破91.79%
  • Meta视觉基座DINOv3王者归来:自监督首次全面超越弱监督,商用开源
  • 多突触神经元模型问世,国内团队打造类脑计算新引擎,登上《自然·通讯》
  • Science封面:高效精准模拟构象变化,微软研究院用生成式AI重塑蛋白质功能研究
  • 扎克伯格看OpenAI直播挖人,北大校友孙之清加入Meta
  • AI 模特时代到来:字节x清华推出商用级视频换装模型DreamVVT,保真度显著领先SOTA
  • LeetCode刷够100小时,学会找人内推,OpenAI员工下场教你拿Offer
  • xAI元老离职干风投,传奇人物Babuschkin长文追忆与马斯克创业战友情
  • 链式思维是幻象吗?从数据分布视角重新审视大模型推理,马斯克回复,Grok破防
  • 李想:i8 反响不错,产品力没对手;库克暗示:苹果将推桌面机器人;中国日均消耗 30 万亿 Token,暴涨 300 倍
  • ChatGPT会让大脑退化?OpenAI高管用它救下自己「读写障碍」的女儿
  • 谷歌超级编码智能体正式上岗!125刀大会员,每天300任务任意跑
  • Meta华人天才毕树超「叛逃」预言:OpenAI未竟交互革命,暗藏万亿赛道
  • 美国CS就业梦碎!狂投5000家0 Offer,名校毕业00后被麦当劳惨拒
  • 3 分钟,我学会了像鸟儿一样飞行 | New Things
  • 从隐私计算迈向六大数据流通全栈技术,“隐语”开源社区升级
  • 7天,一场风暴!理想 i8「刮骨疗毒」,怒砍两个版本
  • 小订过万!打死不说价格的全新小鹏 P7,用颜值吊起了所有人的胃口!
  • 对话理想智驾负责人:撕掉「奶爸车」标签,智驶是理想的「新引擎」
  • 告别「偏科生」时代!36 万的坦克500,让对手从此无路可走
  • 万字长谈王小川:不再迎合他人做学霸,我要解自己的命题
  • 刚刚,全网最懂图文调研的智能体模型震撼上线,看完我直接卸了浏览器
  • ICCV 2025 | HVPL:分层视觉提示学习,让“视频实例分割”模型告别灾难性遗忘
  • 复旦&微软提出StableAvatar: 首个端到端“无限时长”音频驱动的人类视频生成新框架!
  • 千支队伍争锋!首届「启智杯」算法大赛圆满落幕,助推AI应用落地
  • 冗长响应缩减80%,DeepSeek GRPO获得颠覆性改进,微软GFPO问世
  • ICCV 2025 | HERMES:首个统一3D场景理解与生成的世界模型
  • 苹果 AI 下半场:年底问世的新 Siri,要彻底改变 iPhone 的交互
  • GNN+KAN,把三角函数当「激活」选项,山大、南洋理工让分子图更会读化学子结构
  • 港大联手月之暗面等开源OpenCUA:人人可造专属电脑智能体
  • 破解「长程智能体」RL训练难题,腾讯提出RLVMR框架,让7B模型「思考」比肩GPT-4o
  • AI独角兽498家,估值2.7万亿美元;《王者荣耀》连续三年成全球最吸金手游;抖音测试「快递」服务|极客早知道
  • 奥特曼公然叫板马斯克!重金杀入脑机接口,硅谷两大巨头彻底决裂
  • AI女友24h陪玩,全球800万人上头!这群AI创企靠百度开挂
  • 马斯克删除xAI「研究员」职位引爆网络!LeCun怒批:如此暴力将扼杀创新
  • OpenAI女CEO太狠了!智商148,GPT-5才是真印钞机
  • AI 和海外游戏发力,腾讯重回 7000 亿美金
  • 博士申请 | 休斯敦大学计算机系刘锦阳老师招收高性能计算/数据压缩方向博士生
  • Kimi K2背后的冷门绝招:海量语料“重写”如何榨干每个token?
  • ICML 2025 | 奖励模型还用人标?APEC用对抗模仿生成偏好,泛化能力直线上升
  • Attention Sink的起源找到了?清华×美团首次锁定MoE中的「超级专家」
  • 告别Transformer,重塑机器学习范式:上海交大首个「类人脑」大模型诞生
  • AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」
  • Agent狂欢下的冷思考:为什么说Data&AI数据基础设施,才是AI时代Infra新范式
  • AI顶会模式出了问题? 「不发表,就出局」的恶性循环,正在压垮整个AI学界
  • 研究者警告:强化学习暗藏「策略悬崖」危机,AI对齐的根本性挑战浮现
  • 多模态大脑建模技术迈入新纪元:Meta 10亿参数模型获Algonauts 2025大脑建模竞赛冠军
  • OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了
  • 当人们怀念 GPT-4o,他们在「怀念」什么?
  • IEEE TPAMI 南洋理工&哈工大提出 MARCONet++ 攻克中文文本图像超分难题
  • 耶鲁&大连理工&南洋理工等提出MDCNeXt:X射线下的“动力电池缺陷精准检测”新范式
  • 6秒造一个「视频博主」,Pika让一切图片开口说话
  • 破解AI创企的「不可能三角」,解药不止「大模型」
  • OpenAI和奥特曼将投资一家脑机接口公司,直接与马斯克的Neuralink竞争
  • 大型语言模型稳定强化学习的新路径:几何平均策略优化GMPO
  • 传 DeepSeek-R2 8 月发布;微信测试信用借款功能;Perplexity 要 345 亿美元收购 Chrome
  • 一觉醒来,GitHub没了?CEO辞职,微软接管,开发者天塌了
  • AI全国榜单爆冷,全网吃瓜大狂欢!这家黑马竟靠DeepSeek杀进全国TOP 2
  • 物理学「AlphaGo时刻」?40年未竟之事被AI一举攻破,顶尖物理学家集体傻眼
  • 刚刚,商汤内部两万字复盘曝光:多模态通往AGI核心路线首次公开
  • 让强化学习快如闪电:FlashRL一条命令实现极速Rollout,已全部开源
  • 从物竞天择到智能进化,首篇自进化智能体综述的ASI之路
  • 破解效率与成本难题:华为UCM技术推动AI推理体验升级
  • SIGGRAPH上,英伟达发布物理AI开源新技术,更新RTX Pro产品线
  • 身家25亿刀,是四家公司创始人,这位伯克利教授还在给本科生上课
  • 商汤王晓刚:世界模型将加快AI从数字空间进入物理世界,「悟能」想做那个桥梁
  • 北京内推 | 度小满金融视觉和多模态团队招聘视觉多模态算法实习生
  • 实验室抢显卡抢破头?A800/H800骨折价来袭,超值返券助你轻松冲DDL!
  • 后训练轻量「小枝」强势出击!极限剪裁视觉token,推理加速154%
  • ICCV 2025 | LightSwitch:CMU提出材质引导的扩散模型,2分钟实现高质量三维场景重打光
  • TCSVT 2025 | 跨模态学习助力复杂工业过程异常检测:FmFormer框架与基准测试新突破
  • AI全面挖掘微蛋白价值:首次引入合成负样本训练,剔除92%噪声,摆脱保守依赖
  • 是「福尔摩斯」,也是「列文虎克」,智谱把OpenAI藏着掖着的视觉推理能力开源了
  • 东方理工·甬江论坛|新大学、新使命,邀你共启未来
  • LLM总是把简单任务复杂化,Karpathy无语:有些任务无需那么多思考
  • ICCV 2025 | 小红书AIGC团队提出图像和视频换脸新算法DynamicFace
  • 聚焦前沿,见证未来!「X·创新』产品SHOW圆满举办!
  • 刚刚,OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺得IMO金牌
  • Lumina-mGPT 2.0:自回归模型华丽复兴,媲美顶尖扩散模型
  • 雷军:小米YU7改名,被误会是丐版;传淘宝闪购周末峰值超美团;低价 MacBook 或年底亮相,599 美元
  • OpenAI开源霸权5天终结,百川M2一战夺冠!实测比GPT更懂中国医疗
  • 硅谷精英放弃生娃!MIT女记者揭秘:人类只是AI垫脚石,世界很快就毁灭
  • 41个榜单SOTA!智谱最新开源GLM-4.5V实测:看图猜地址、视频秒变代码
  • 2025全球大模型应用报告:红海混战「忠诚度」瓦解,用户脚踏4.7条船!
  • 昆仑万维发布新模型 SkyReels-A3,开启五天技术发布周
  • 世界机器人大会:笨拙的今天,与狂奔的明天
  • 「一只手有几根手指」,你的GPT-5答对了吗?
  • 4D空间智能:AI如何一步步「看懂」时空结构?一篇综述解析通往四维世界的五大层次
  • 智谱终于发布GLM-4.5技术报告,从预训练到后训练,细节大公开
  • 从捍卫者到引路人,上交&上海AI Lab提出LEGION:不仅是AI图像伪造克星,还能反哺生成模型进化?
  • ICCV 2025 | 机器人自主探索未知复杂空间?GLEAM破解主动探索建图的泛化难题
  • 脑子比不过AI,手也要沦陷了?这只灵巧手看得我有点慌
  • 第二届 “兴智杯” 全国人工智能创新应用大赛专题活动明天开启,技术解析 + 资源对接一站式平台重磅来袭!
  • 机器人上下文协议首次开源:阿里达摩院一口气放出具身智能「三大件」
  • Attention Sink产生的起点?清华&美团首次揭秘MoE LLM中的超级专家机制
  • 具身智能技术与应用论坛圆满举行,北京人形公布多项创新成果
  • ACL 2025 | 湖南大学、腾讯生命科学实验室等提出蛋白互作预测新方法,让LLM学会解读蛋白质网络
  • 宇树、银河通用都在用:英伟达「物理AI」技术亮相世界机器人大会
  • CVPR 2025 | DPC:用于微调视觉-语言模型的双提示协作
  • ICCV 2025 | 终结灾难性遗忘!南大提出外部知识注入机制,刷新CLIP持续学习SOTA
  • 超越样本级RL!人大×快手提出ARPO:熵驱动Agent探索,多轮推理性能飙升
  • 北京/上海内推 | 盛大集团AI创新中心招聘大模型/Agent方向算法实习生
  • 毒液抗菌搭配深度学习,千万级数据组中筛得386条备选,91.4%体外验证成功

GPT-5首次会推理,OpenAI联创曝AGI秘诀!超临界学习吞噬算力,2045金钱无用?



  新智元报道  

编辑:桃子
【新智元导读】GPT-5是一个分水岭,终于学会了「推理」。联创Greg Brockman最新访谈畅谈了OpenAI AGI之路,未来AI可以做到边用边学,在超临界模式下推导出N阶后果。

「GPT-5,是一个分水岭」。

昨天,OpenAI联创Greg Brockman在Latent Space团队的专访中对GPT-5做出了高度的评价。

这一小时的访谈,含金量极高。

从GPT-5 的意义、推理与强化学习的转折点,到算力瓶颈、AI工程实践,再到对未来社会的预判,Greg Brockman的对话透露了OpenAI最新战略的思考。

他还表示,「当内部训完GPT-4时,我们就知道下一步必须走向推理范式。这不是新想法,而是让模型变得可靠的唯一途径」。

以下是,全文访谈的核心亮点:

· GPT-4持续对话,但不够可靠;GPT-5开始真正学会「推理」

· 未来模型不再是「一次训练+无限推理」,而是边用边学

· 超临界学习:AI学到的不止是答案,还能推导出后果链

· 使用AI是一门管理学,要当多智能体的经理人。

· 唯一稀缺的,是算力


GPT-5,一个分水岭


谈及GPT-5时,Greg强调这是OpenAI首个「混合模型」,通过路由器在推理模型与非推理模型之间自动切换。

这种模式降低了使用复杂度,避免用户纠结于「该选哪个版本」。

从性能上看,GPT-5 已经在数学、编程、物理等高智力任务上表现出质变。

对此,Greg将其与前几代旗舰做了一个鲜明的对比。

GPT-3出世后,所具备的文本能力还很浅,甚至连「排序数字」这样的基础任务都做不好。

到了GPT-4,其实用性大幅提升,成为广泛商用的基础,但在真正深度智力上仍有欠缺。

「而GPT-5,则是一个分水岭」。

GPT-5在极难的领域上,如IMO、IOI国际比赛中,已经能写出与最优秀人类相当的证明。

这在过去是极大的挑战,而现在我们能用少数人团队把它解决掉。

更令人震惊的是,物理学家已经反馈,GPT-5 给出的推理过程,能重现他们花了数月研究才得出的见解。

这意味着,模型已经不再只是「辅助写作工具」,而是真正的科研合作者。

他还提到,OpenAI在GPT-4之后,做出了一个关键的判断:

光靠海量预训练数据,根本无法让模型真正可靠。


早期实验显示,GPT-4虽能连续对话,但常常「跑偏」,并不可靠。

因此,团队认定必须让模型「测试想法——获得反馈——强化学习」,才能缩小与AGI的差距。

Greg解释道,我们希望语言模型能像当年Dota AI一样,从随机初始化的神经网络,最终学到复杂、稳定的行为。

强化学习能把有限的人类任务设计,放大出可靠的智能。

这也是GPT-5背后最大的范式转折:从静态训练,迈向动态推理。

超临界学习


人类学习有「睡眠回放」,AI也在探索「推理-再训练」的循环。

OpenAI模型从「离线训练+大量推理」转向了「推理+基于推理数据的再训练」,逐步接近人类学习的过程。

Greg表示,「我们正在从『一次性训练,无限次推理』的时代,迈向『边推理边训练』的新纪元」。

这个过程中,人类只需设计少量任务,模型通过成千上万次尝试即可学习到复杂行为,但算力消耗巨大。

当算力增加10倍、10000倍,模型就会出现「超临界学习」(Supercritical learning)。

它意味着,LLM学习不仅是掌握当前任务,还要推导二阶、三阶效应。

展望模型未来新应用,Greg在生物研究所的经历让他相信,DNA就像预言一样,可以被神经网络学习。

他表示,对于神经网络来说,人类语言和生物语言没有本质区别,我们在DNA建模上已经能做到GPT-2的水平。

Greg还提到,自己的妻子患有罕见遗传病,AI在医疗上的突破,对于他来说有着更重要的个人意义。


最佳工程实践,打造Prompt武器库


有了如此强大模型,开发者如何将其发挥出最大的效用?

「若要充分发挥模型的潜力,确实需要一些特殊的技巧」。

这需要一种近乎偏执的韧性,去真正摸清模型能力的边界与缺陷的轮廓。

为此,Greg提出了最佳工程实践——

1. 构建AI友好型代码库:模块清晰、单元测试完整、文档详尽;  


2. 拆解任务,让多个智能体并行完成;  


3. 要做「Prompt库」管理,积累自己的提示武器库,不断探索模型的边界。


不过,这些Prompt往往不是唯一正确答案,而是能让模型发挥创造性和多样性的测试。

访谈中, Greg表示,「我始终模型当作一个开发团队,而不是单一的工具」。

它可以远程异步完成任务,也可以像结对编程一样实时协作。

更重要的是,AI不介意被完全「微观管理」,而且还可以被无限复制,这一点是人类开发者无法做到的。

GPT-5在前端测试上表现突出,但开发者不能只「过拟合」某些强项场景,要学会让AI在不同模块间切换,形成完整的工作流。

Greg举了一个例子,自己平时会把非关键任务外包给模型,降低风险,同时还能保持信息流动。

他还豪言,OpenAI正在建造人类史上最庞大的智能机器。相比之下,「阿波罗计划」这样的工程都黯然失色。

即便部分工作被自动化,优秀工程师依然稀缺。

关于当前AI研究现状,Greg指出,不同实验室并非是同质化,而是各自有独特取向。

OpenAI的重点是——下一个范式的转折,优先级包括:推理范式、多模态、应用。


算力,是永恒的瓶颈


下一个未来,算力将成为最炙手可热的资源。

在OpenAI内部,拥有更多计算资源后,研究人员才能开展更大的项目,取得更多的成果。

近来,奥特曼称,我们内部有更强大的模型,但因算力不够,还拿不出来。

谈到AI的极限时,Greg一针见血,「瓶颈永远是算力」。

如果你能给我们更多的算力,我们就能把它转化为更强的模型。


他还将算力比做一种「能量」,预训练是将能量转化为潜在的智力(potential energy),而推理则把智力再次释放为动能(kinetic energy),用于现实世界中的任务。

为此,OpenAI今年开始打造「星际之门」超级集群,不断扩张基础设施。

在Greg看来,未来社会中的「算力分配」将成为核心议题,甚至比财富更加稀缺。

用他的话来说,「未来唯一肯定会稀缺的资源,是算力」。

Greg相信,随着算力Scaling,AI推理深度将呈指数级增长。


2045年:AI生成一切,钱没用了?


访谈中,当主持人问及,你想要发送到2045年一张便条会是什么?

Greg Brockman表示,那将会是一个惊人丰饶的世界,AI的进步可能让我们实现科幻小说中的梦想,甚至迈向多星球文明。

AI的应用空间无比广阔,无论是医疗、教育还是其他行业,都有无数「未被采摘的果实」等待探索。

不过,如何构建一个公平、高效的社会来分配计算资源,将是未来需要深思的问题。

但他也认真强调:

如果AI能免费生成一切物质,金钱可能会失去意义;  


但算力将成为新的稀缺品,谁能获得更多算力,就能做更多事。


采访的最后,Greg回忆起年轻时,常觉得「错过了时代」。

他表示,「我曾以为等到我准备好时,所有酷炫的问题肯定早被解决完了…结果证明这想法大错特错。问题的数量会随时间增长而非减少」。

换句话说,现在依然是进入AI的最佳时机。

参考资料:
https://www.youtube.com/watch?v=35ZWesLrv5A&t=1s  
https://x.com/slow_developer/status/1956741490170106288


<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652620712&amp;idx=1&amp;sn=a9d14d60febdcdab71670f82313c60cf&amp;chksm=f0af000391cd7d4a2687f68a6725a7f4c668975b51f06ba2ddb3eedc74ab148f3ff1a9a3884b&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/G5S2GGwOEc&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们