动态列表

九天大模型大变身：性能狂飙35%！还能一键P大象
万亿参数狂欢！一文刷爆2025年七大顶流大模型架构
豪拒15亿美金天价Offer，硅谷最狂AI巨星身份曝光！小扎、奥特曼抢破头
兔子蹦迪疯传，5亿观看！全球恐慌：一段AI视频把全人类拉入虚拟现场
全网苦等GPT-5，超级对齐团队遗作成重要线索，奥特曼发话「惊喜很多」
图灵奖得主Sutton再突破：强化学习在控制问题上媲美深度强化学习？
GUI定位还在玩「非黑即白」？浙大团队提出GUI-G²，显著提升GUI智能体定位性能
OpenAI IMO金牌团队爆料：AI拒绝作答第六题
特斯拉车祸，被判赔偿超 2 亿美元；传 OpenAI 将推 10 美元「亲民订阅」；影石刘靖康：祝贺同行大疆推全景相机
哥大学生全员AI作弊？小哥「创业逆袭」：不用AI等于输在起跑线！
Hinton预言成真，美国大学生掀起本科辍学潮！月入万刀修马桶，不怕AI裁员
天才美少女的开挂人生，首次揭晓！11岁自学微积分，17岁推翻40年难题
GPT-5难产，外媒爆料：性能提升不大，OpenAI高管Slack上当众破防
19岁小哥伯克利辍学创业，获2800万美元融资，OpenAI投了
通向L3的正确范式？理想i8全球首发VLA高阶辅助驾驶，我们帮你试了试
ICCV 2025 | EPD-Solver:西湖大学发布并行加速扩散采样算法
刚刚，谷歌「IMO金牌」模型上线Gemini，数学家第一时间证明猜想
一个模型超了DeepSeek R1、V3，参数671B，成本不到350万美元
多模态后训练反常识：长思维链SFT和RL的协同困境
库克打气苹果 AI：不拼首创，自信能主导市场；微信提现手续费下调至 0.01 元；Manus 推 Wide Research
微软破4万亿，被裁员工扎心！70级工程师天价薪酬曝光：入职大礼包2700万
港科大发布「大模型越狱攻击」评估基准，覆盖37种、6大类别方法
刚刚，OpenAI神秘开源模型泄露！「闪现」1分钟被删，配置被网友扒光
24岁辍学博士，小扎捧2.5亿薪酬包亲自上门抢人！AI顶薪已让NBA汗颜
奕派科技重磅发布“未来之翼”战略，2026款东风奕派eπ008限时先享价17.36万元
一切竞争，都变成了「AI 竞争」
途深智合推出旗下AI科研品牌--追梦AI
模型共享、数据互通、设施互连，上海人工智能实验室上线「书生」科学发现平台
一次中稿10篇ACL25，通义实验室代码智能&对话智能团队在研究什么
联合三大蛋白质模型，仅需4~6周，定制癌细胞特效「识别器」
全球首款通用AI科研智能体问世：我一个文科生用它写了份CRISPR基因编辑综述报告
中国在AI领域超越美国已是板上钉钉？吴恩达：美国无法保持领先
驯服复杂表格：九天重磅开源，开启「人与表格对话」智能新时代
思维链监督和强化的图表推理，7B模型媲美闭源大尺寸模型
超聚变亮相WAIC 2025 重构数智化平台，共建智能体时代
Manus大升级，100多个智能体并发给你做任务
挖人上瘾的Meta又被员工吐嘈：不帮忙宣传项目，开源只会越来越糟
机器人不只会抓和放！北京大学X银河通用「世界-动作模型」赋能全面泛化的非抓握技能
火山引擎作为「AI 原生」基础设施，变得更强了
英伟达回应「芯片后门」：不存在后门；大疆推 Osmo 360 全景相机，2999元；微软成第二家 4 万亿美元公司
WAIC唯一指定C位，AI「国家队」又赢麻了！秒懂Hinton伦敦腔，现场杀疯老外狂点赞
首部法律LLM全景综述发布！双重视角分类法、技术进展与伦理治理
小扎一夜反水，背刺开源！亲手葬送「Llama神话」，股价大涨12%
GPT-5发布倒计时？全网泄露来了：微软Copilot憋大招，GPT-5上线最后冲刺！
17.98 万的乐道 L90，有多少蔚来的诚意，就有多少李斌的「求生欲」
ACL'25最佳论文独家解读：大模型有「抗改造」基因，现有后训练范式失灵预警
当提示词优化器学会进化，竟能胜过强化学习
ACL 2025主会论文 | TRIDENT：基于三维多样化红队数据合成的LLM安全增强方法
谷歌发布AlphaEarth基础模型：构建「地球版ChatGPT」，融合多源数据，实现10米级地球观测
微软花重金做的Copilot，居然被WPS一个按钮给秒了?
定义科学智能2.0：在WAIC，复旦与上智院的答案是开放协作、科学家为中心，以及一个「合作伙伴」
OpenAI提出的CLIP，被Meta联合谢赛宁、刘壮，扩展到全球300+语言
VLA-OS：NUS邵林团队探究机器人VLA做任务推理的秘密
XREAL One Pro 体验：AR 老炮的自我革命
WAIC UP! 之夜：一场关于AI与人类未来的星空思辨
AI 智能体，让每个人可以像科学家一样工作和思考
刚刚，扎克伯格公开信：Meta不会开源全部模型
没敲过代码的我，半小时「聊」出一个能用能分享的「小程序」
把指纹焊死在频率上：抗微调神经网络指纹的硬核方案来了
32.18万起！理想i8正面「硬刚」特斯拉Model X
智能驾驶最大的障碍，不是懂车帝
刚刚，DeepSeek梁文锋NSA论文、北大杨耀东团队摘得ACL 2025最佳论文
小米青年公寓正式启用，1999 元/月；Meta AI 数据中心投入 720 亿美元；NBA 引入「AI 篮球」
AI百人榜刷屏，小扎照单全收？辛顿Ilya师徒霸榜，第二名竟是本科生
炮轰黄仁勋，决裂奥特曼！1700亿美元估值背后，硅谷最不好惹的AI狂人
别只盯着李飞飞！AI的「3D数据底座」已被这家中国公司悄悄建好
无需准确传感信号！轻松搞定「多段软体机械臂」复杂位姿与形状控制
Nature 子刊 | DeepSeek落户超750家医院，清华团队剖析AI医疗监管隐忧
P图手残党有救了，豆包·图像编辑模型3.0上线，一个对话框搞定「增删改替」
开出10亿美元天价，小扎挖人Mira创业公司惨遭拒：俺们不差钱
当智能成为主要生产资料，硅基经济学引爆「AI+金融」
SPIRAL：零和游戏自对弈成为语言模型推理训练的「免费午餐」
刚刚，OpenAI推出学习模式，AI教师真来了，系统提示词已泄露
凌晨，Qwen又更新了，3090就能跑，3B激活媲美GPT-4o
AI安全上，开源仍胜闭源，Meta、UCB防御LLM提示词注入攻击
字节辟谣「豆包汽车」：无造车计划；英伟达市值突破4.3 万亿美元；传特斯拉将推「低价赛博皮卡」
科学能力太强，这个多模态推理「六边形战士」被严重低估！Intern-S1开源登顶
全球首次，「AI记忆」开源落地！MIRIX同步上线APP
GPT-5基准测试泄露，被曝两天后发布？打Minecraft震撼开挂网友直呼封神
马斯克偷偷憋了个大招！Grok秒出《阿凡达》画质，好莱坞瑟瑟发抖？
理想i8正式发布：首款纯电SUV，售价32.18万元起
WAIC 2025大黑马，一个「谢耳朵AI」如何用分子式超越Grok-4
通义实验室大火的 WebAgent 续作：全开源模型方案超过GPT4.1 , 收获开源SOTA
这家国内公司，在给具身智能技术栈做「通解」
ACL首届博士论文奖公布，华人学者李曼玲获荣誉提名
全球首个全链式空间天气AI预报模型“风宇”！国家卫星气象中心牵头，联合南昌大学、华为共同研发
LeCun出手，造出视频世界模型，挑战英伟达COSMOS
联合十余家国产生态，商汤大装置发布“算力Mall”，打造算力超级市场
用说的就能做 App，这家公司想做 AI 时代的 ins
从数字人到「有温度的」机器人，京东把 AI 深度应用的路线图「摸透」了
开启RL Scaling新纪元，siiRL开源：完全分布式强化学习框架，支持超千卡规模高效训练
共青年之智，铸AGI未来｜2025 WAIC云帆奖得主名单揭晓
阿里再开源，全球首个MoE视频生成模型登场，电影级美学效果一触即达
不靠海量数据，如何精准喂养大模型？上交Data Whisperer：免训练数据选择法，10%数据逼近全量效果
WAIC2025，斑马智行元神AI获国际测评机构全项第一
蛋白质基座的GPT时代来了？AMix用Test-time Scaling让蛋白质设计迈向通用智能
Allegro-FM：剑指分子动力学基础模型，零样本预测89种元素及复杂反应
AI 上新｜不会用 PS 的我，却敢去小红书上接「设计单」了
GMI Cloud 于 WAIC 2025 展现全栈 AI 基建实力，破解出海成本与效率难题
WAIC 2025: 斑马智行元神AI大模型，获全球机构测评第一
国内首例！由钉钉AI平台训练的豆蔻大模型通过妇产科主任医师考试
闭幕式 | 2025世界人工智能大会暨人工智能全球治理高级别会议成功举办
智谱发布新一代基座模型GLM-4.5：开源、高效、低价，专为智能体而生
AI Agents的“超级大脑”来了阿里云正式发布无影Agentbay
WAIC 2025前探：AI硬件如何改变我们的日常生活
这届WAIC，无问芯穹发布了三个「盒子」
「幻觉」竟是Karpathy十年前命名的？这个AI圈起名大师带火了多少概念？
EvaLearn：AI下半场的全新评测范式！
蚂蚁数科发布金融推理大模型助力金融机构加速落地智能体应用
2025 WAIC容联云AI AGENT论坛启幕，以技术引擎驱动产业智能跃迁
商汤大装置亮相WAIC 2025，多项标志性成果打造AI基础设施新范式
广大、清华等开发EdgeAIGC，让边缘缓存命中率飙升41%，AIGC延迟与成本双降
WAIC直击｜快手可灵AI引领「生成式AI应用元年」，累计生成超2亿视频
硬核「吵」了30分钟：这场大模型圆桌，把AI行业的分歧说透了
ICCV 2025｜UV-CoT：无监督视觉推理新突破，偏好优化重塑图像级思维链
扣子开源全家桶，Apache 2.0加持，AI Agent又一次卷到起飞
多模态大模型，真的「懂」世界吗？——揭秘 MLLM 的核心知识缺陷
具身智能，腾讯「低调入局」
首次结合RL与SFT各自优势，动态引导模型实现推理⾼效训练
特斯拉廉价 Model Y 减配内饰曝光；Firefox 终止中国账户运营；宇树王兴兴：经常偷懒，用 AI 写代码｜极客早知道

GPT-5难产内幕曝光！核心团队遭挖空，推理魔咒难破，靠英伟达续命

2025-08-02未知作者来源

新智元报道

编辑：Aeneas

【新智元导读】GPT-5，曾经差点难产？这条诞生路，简直是烈火炼真金。一边是人才出走、小扎截胡、团队内部陷入混乱，另一边，推理模型魔咒让研究者苦恼不已，项目甚至一度停摆。外媒曝出这期GPT-5诞生内幕，可谓亮点满满，干货十足。

就在刚刚，外媒The Information曝出了关于GPT-5的一大波最新内幕，众多猛料来了！

比如，GPT-5并未取得技术突破，不存在GPT-3到GPT-4这种级别的跃升。

比如，OpenAI正面临着严重的数据瓶颈和技术难题。

还有一个劲爆大瓜，OpenAI大波核心研究者一下子被小扎撬走，直接导致了OpenAI内部的组织架构混乱！

为此，研究副总裁Jerry Tworek在Slack上公开向研究主管Mark Chen抱怨，许多同事都看到了。

不过，就在这么一篇唱衰的文章发布之际，OpenAI同时又有好消息了。

近日，OpenAI又获得了一笔巨额融资。据悉，OpenAI已提前数月筹集了83亿美元资金，这就导致它的估值直接达到3000亿美元，这是今年400亿美元融资计划的一部分。

参与此轮融资的，有一大波全新投资者，其中Dragoneer投资集团以28亿美元领投本轮，Blackstone、TPG、Fidelity、Founders Fund、红杉资本等跟投。

不过，虽说Dragoneer是本轮融资的最大出资方，但软银仍是整个400亿融资计划的牵头者。

GPT-5还没发布，各方势力都下场了，这不免让人把期待值拉满，屏息等待下周的盛况了。

Orion陨落真相

GPT-5没做出来，降级成4.5了

去年万众瞩目的Orion，大家应该都还记得。

The Information爆料说，2024年下半年的大部分时间里，OpenAI都在全力开发Orion模型，它被寄予了厚望，原计划作为GPT-5推出。

跟5月发布的旗舰模型GPT-4o相比，Orion本该有巨大飞跃。

结果它的性能令人大失所望，最终只能被降级成GPT-4.5，在今年2月推出。默默上线后，GPT-4.5迅速淡出公众视野。

所以，Orion为何会失败？

最核心的原因就在于，团队摸到了预训练阶段的天花板。因为高质量网络数据已经日益枯竭，训练小模型时还有效的技巧，在大模型身上竟然就会失效。

这不光导致了GPT-5的延期，也让OpenAI的团队内部陷入了自我怀疑。

GPT-5，根本没有GPT-3到GPT-4级的跃迁

这个从神坛跌落的故事，要从去年12月说起。

当时，OpenAI的研究者完成了一项内部测试，结果震惊了整个团队。

他们发现，当给一个新模型更多算力和思考时间，它就像开了挂一样，复杂推理信手拈来，执行任务出色到惊人。

然而，激动的工程师们很快发现，这份兴奋只是暂时的。

当他们把这个新模型转化为o3聊天版本时，那种惊人的性能提升消失了。

可以说，这次事件，正是OpenAI在今年大部分时间里所面临技术挑战的一个缩影。这让OpenAI不仅内部技术进展缓慢，大获成功的ChatGPT业务也受到波及。

GPT-5发布前夕，各类泄露和爆料已经是满天飞。

比如，它的编程和数学能力又有了显著提升。另外，它在驱动AI智能体方面也优于前代模型，只需要极少人工监督，就能处理复杂任务。

它能遵循极其复杂的指令，比如支持智能体何时应批准退款的规则。而在以往，模型需要学习多个棘手的「边缘案例」，才能处理此类退款。

但总的来说，这些改进根本无法与2020年GPT-3到2023年的GPT-4之间的性能飞跃相提并论。

也就是说，我们需要做好对GPT-5失望的准备。

不过，OpenAI模型的任何改进，即便是渐进式的，也能刺激客户需求，以及给投资者信心。这样才能支持OpenAI未来三年半烧掉450亿的计划，毕竟租用服务器实在是太昂贵了。

高管为何相信GPT-8？

最近曾有OpenAI高管向投资者透露：沿着目前架构，他们相信模型有朝一日会达到GPT-8的水平。

CEO奥特曼也表示过，利用现有技术，OpenAI有望创造出AGI。

是什么给了他们这样的信念？

一位了解内情的微软员工透露了玄机：测试GPT-5后，他们发现它在不消耗更多算力的情况下，就能生成更高质量的代码和文本。

部分原因在于，它学会了精准判断出不同任务所需的计算资源量。

内部「混乱不堪」

不过OpenAI内部，可并非一片和谐。

比如一些高级研究者，非常抵触将自己的成果交给微软，尽管这位最大股东拥有的合同权利截至到2030年。

虽然两家公司财务紧密，但在具体合作条款上，却始终争执不休。最新信息是，OpenAI重组营利性部门后，微软很可能在其中获得33%的股份。

而小扎以天价薪酬挖走的团队，也让OpenAI内部陷入了更大的混乱。

走了这么多人，只能紧急进行组织架构调整。

上周，OpenAI的研究副总裁Jerry Tworek在Slack上向上司、研究主管Mark Chen抱怨团队变动的事，许多同事都看到了这条信息。

当时，Tworek表示需要休假一周来重新思考，但最终并未休假。

绝境中的转机

推理模型的意外崛起

总之，直到今年6月，情况依然很严峻：OpenAI开发的模型中，没有一个能顶得住GPT-5的名号。

好在，「推理模型」成了他们的全新突破口。

23年末一项名为Q*的技术突破，能解决前所未见的数学问题，在OpenAI研究者中引发了巨大震动。

基于Q*，OpenAI开发了许多推理模型，在获得更多算力时，它们就会表现更佳——看起来，预训练的性能增长瓶颈，就要被克服了。

去年秋天，第一个推理模型正式推出，它就是o1。24年底，OpenAI利用与o1基础相同的GPT-4o，又推出了推理模型o3。

据说，虽然师出同门，但o3的教师模型在理解科学知识方面，比o1的教师模型进步大得多。

背后原因，就是OpenAI用了更多英伟达芯片来开发o3的教师模型，这就让它理解复杂概念时能力更强。

还有一个原因，就是它被赋予了搜索网络，以及从代码库中提取信息的能力。

并且，它也同样受益于强化学习。此过程中，人类专家在生物学、软件工程和医学上提出刁钻的问题和答案，然后让模型针对这些问题生成数千个自己的回答。

随后，OpenAI会利用那些与人类专家得出相同答案的AI生成回答（也即「合成数据」）来训练模型。

推理模型

为何总翻车

o3模型发布后，一度成为全球头条，引发病毒式讨论，然而现实很快给了当头一棒。

当o3的教师模型转换为学生模型，变成一个可以让人们提问的聊天版本时，它的性能显著下降，甚至跟o1相比没有任何区别。

同样，创建让企业通过API购买的版本时，同样的问题也出现了。

有知情人分析，原因是这样的：o3理解概念的方式很独特，跟人类的交流方式大相径庭。

因此，如果创建一个聊天版本，其实就拉低了这个原始天才级模型的智能水平，因为它被迫用人类语言，而非自己的语言去交流。这种情况下，它的推理链条就会被迫压缩、扭曲。

甚至有开发者在调试时，偶尔能看到模型输出「乱码」般的中间语言——那可能就是它「思考」的原始形态，也就是这个天才原本的样子。

还有人认为，OpenAI没有投入足够精力来训练模型在聊天场景中与人类进行有效沟通。

总之，o系列模型让ChatGPT的用户非常困惑，因此公司决定重新回归GPT的命名体系。

「通用验证器」

好在，OpenAI还有办法。

据悉，内部正在开发一种「通用验证器」，可以自动化地确保模型在RL过程中产生高质量的答案。

本质上，这个过程是让一个LLM承担起检查和评估另一个模型答案的任务，并利用各种信息源来对答案进行研究核实。

前一阵OpenAI的模型在数学竞赛中拿了金牌后，高级研究员Alexander Wei在X上表示，他们所使用的强化学习方法是「通用」的。

也就是说，这个模型不仅能检查编程这种标准答案清晰的内容，甚至还能判断写作这种主观性很强的内容质量。

这就对GPT-5助力极大！

OpenAI强化学习团队负责人Tworek最近也公开表示，自己认同这个观点：OpenAI模型背后的强化学习系统，其实已经具备了通往AGI的潜力。

目前，包括xAI和谷歌在内的AI大厂都已加倍押注强化学习。

上周，Altman在播客节目中，描述GPT-5的能力说，它轻松解决了一个他根本看不懂的问题，直接让他坐到椅子上，感到晕眩。

这就进一步点燃了我们对GPT-5的狂热期待。

「在几乎所有方面，GPT-5都比我们更聪明。」

究竟什么样的模型，才配叫作GPT-5？好在，我们要等的时间不多了。

参考资料：

https://www.theinformation.com/articles/inside-openais-rocky-path-gpt-5?rc=epv9gi

<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652615980&amp;idx=1&amp;sn=5cf212254d0dfa379b4a4a20542c7c8c&amp;chksm=f0b68298f3c30c7fcfc0edd139530040e6b47af291a3106df48483fbf012a9669a6aecfcad0e&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/PmkmOzEtrV&amp;maxage=1y"  width="1px"></div></div></body></html>

动态列表

新智元报道

类别

资源

联系我们