动态列表

  • 陶哲轩联手ChatGPT!10分钟击碎30年「无理」难题,数学圈炸裂
  • 顿悟不是玄学!港科大清华等联手:撕开推理黑箱,RL让AI像人思考
  • 4万亿帝国接班人浮出水面!苹果不需要另一个库克
  • 刚刚,2025年诺贝尔物理学奖揭晓!量子计算成最大赢家
  • 告别梯度!Evolution Strategies全参微调挑战PPO/GRPO:更稳、更省、更好复现
  • NeurIPS 2025 | 北邮用“图+文”把人物检索拉满:自动合成数据 × 细粒度特征对齐
  • TPAMI 2025 | 电子科大等提出EEMFlow:从事件相机学习高效Meshflow与光流,速度提升30倍
  • MICCAI 2025 | 莱斯大学提出MetaSeg:参数减少90%,元学习隐式网络重塑医学图像分割
  • OpenAI 与 AMD 签百亿美元协议,后者股价暴涨;特斯拉廉价 Model Y 将于 7 日发布;知名旅行、听歌应用入住 ChatGPT
  • 乔纳森下一个iPhone神话,要黄了?OpenAI秘密AI硬件深陷三重困境
  • 3年手搓ChatGPT!剑桥天才少年在Minecraft游戏中爆火回归
  • 一举击败Claude Code!微软提出代码生成黑科技:一键直出36K行代码
  • 刚刚,2025年诺贝尔生理学或医学奖揭晓!三位得主点燃器官移植希望
  • OpenAI入股AMD,股价暴涨35%!奥特曼左手黄仁勋,右手苏姿丰,通吃全球算力
  • 真实数据、全链路、可复核:GenoMAS打造更可信的基因分析智能体
  • 自进化Agent的第三种可能:隐式记忆,不动模型参数,胜过GRPO
  • NeurIPS 2025 | 高通提出GCL:无需额外数据,通用多模态检索迎来“一统江湖”新范式
  • NeurIPS 2025 | 慕尼黑工业大学提出SIM(3)等变网络:让3D形状补全告别“姿态偏见”,实现跨域泛化
  • 今日迎本世纪「最晚中秋月圆」;雷军:小米17 五天销量破百万;ChatGPT 或添私信聊天功能
  • 腾讯王者归来:混元图像3.0登顶LMArena!一手实测全球最强图像AI
  • AI「学不会」竟成相变探针!UCSD华人联手谷歌等,曝光量子纠缠秘密
  • 最新,2025诺奖预测出炉!中国科学家有望拿下化学奖?
  • 奥特曼:感受不到GPT-5变强,是因为你还不够「专业」
  • GPT-6或将比GPT-5强10倍!奥特曼揭秘ChatGPT如何诞生
  • 宾大提出F³:事件相机迎来“预测性”表征新范式,光流、分割、深度全SOTA!
  • LSTM之父再出手!xLSTM挑战Transformer:一场关于Scaling Laws的正面交锋
  • NeurIPS 2025 | AI也能做数学建模?本科生携手MM-Agent勇夺美赛全球前2%
  • “移步换景”一试,大模型全乱了:OST-Bench揭示MLLM时空推理短板
  • 微软下架「炉石」等多款游戏;华为云:华为算力效能超英伟达芯片 3 倍;马斯克回应特斯拉机器人打拳:并非遥控
  • 陶哲轩联手GPT-5,1小时攻克数学难题!全程无需编码,OpenAI副总惊呼
  • 1亿签约金抢AI大神?谷歌AI元老劝退全网:别再读博了!
  • 三天逆袭,Sora登顶美榜!15秒大片玩疯奥特曼,全网直呼真假难辨
  • 10个Agent一键组队:并行智能体协作,端到端交付从24h缩减到4h!
  • 首位AI女演员出道!好莱坞「天敌」来了,下一代偶像全是代码制造?
  • 南理工提出FMC-DETR:巧用“频率解耦”,航拍小目标检测精度飙升8.2% AP50
  • 网红挑战特斯拉FSD穿越美国出车祸;小米回应「小米汽车突然自己开走」;Sora 登顶美区苹果商城免费榜
  • 刚刚,Anthropic紧急换帅!新任CTO执掌算力命脉,直面OpenAI千亿赌局
  • Gemini 3.0 Pro内测流出,编程实力惊人!下周上线
  • 刚刚,奥特曼首曝:AI取代CEO后,我想去当农民!
  • 华人主导谷歌SLED,论文登顶会!一键让模型学会自救
  • LeCun考虑辞职!Meta AI百亿豪赌引爆「内战」,逼走首席科学家
  • NeurIPS 2025 | RAD:基于大规模3DGS孪生数字世界的端到端强化学习训练策略
  • 小米 17 系列销量超百万;苹果新产品泄密源头疑为越南工厂;低价版 model Y 现身官网代码|极客早知道
  • 刚刚,这家0产品0模型就估值854亿的公司,终于发布了首款产品!
  • 刚刚,奥特曼亲赴,韩国「举国」投靠!
  • 奥特曼「一张脸」引爆全球狂欢!Sora 2冲上APP榜第三,邀请码炒到1250元
  • 60岁老人AI养生三个月吃进医院!「AI精神病」全球扩散,OpenAI急招医生
  • 一杯咖啡,3亿美金!斯坦福天才少女退学创业,Meta AI大牛排队加入
  • 武大新作MASt3R-Fusion:融合IMU与GNSS,为新一代视觉SLAM注入“多感官”智慧
  • 中科大、清华、快手等发布OpenGPT-4o-Image:为多模态AI打造的“超级燃料”,图像编辑性能提升18%
  • 历史首位,马斯克身家突破 5000 亿美元;王腾注销、清空多个社媒账号;美国演员工会抵制 AI 演员
  • 刚刚,OpenAI Sora 2重磅登场!首个APP上线,或将成为AI时代新TikTok
  • Sora 2全网疯狂实测:以假乱真、脑洞大开、虚实难分|附首个APP教程和邀请码
  • OpenAI和DeepMind大佬离职联手,誓用AI科学家实现室温超导!已融3亿美元
  • 天津大学联合腾讯提出Wan-Alpha:一键生成高质量透明视频,发丝级抠图不再是梦
  • 南洋理工联合商汤提出Visual Jigsaw:像玩拼图一样,显著提升多模态大模型的视觉理解力
  • OpenAI 深夜重磅推出新视频模型和独立 App;英伟达市值突破4.5万亿美元;特斯拉预计推出第三代人形机器人 | 极客早知道

刚刚,奥特曼官宣ChatGPT「终极OS入口」!8分钟速搭智能体,8亿人狂欢



  新智元报道  

编辑:桃子 定慧
【新智元导读】OpenAI 2025开发者日上,全场座无虚席。奥特曼重磅官宣四大更新:首发Apps SDK要把ChatGPT打造为「操作系统终极入口」,一键拖拽构建智能体AgentKit,无代码Codex开发,以及Sora 2等三大API登场。OpenAI的野心,彻底藏不住了。


一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发


OpenAI 2025开发者日,奥特曼的精彩演讲引爆全场!

现场,50分钟发布会,奥特曼重磅官宣了四项重大更新

  • Apps SDK:与外部应用无缝集成,OpenAI最大野心——把ChatGPT打造成未来的操作系统;

  • AgentKit:无需编码,拖放搭建智能体。人人都可快速开发智能体,还能评估智能体能力;

  • Codex全面可用:不写一行代码,打造爆款APP;

  • API更新:三大API更新,Sora 2 API同步上线。

最最重磅的,还是Apps SDK,所有人皆可在ChatGPT中构建原生应用,其意义堪比2023年首发的GPTs。

这预示着,ChatGPT又将成为一个新时代的「APP Store」!

正如爆料所言,AgentBuilder让智能体构建变得像搭积木一样简单直观。现场,仅用8分钟拖拽,便一键完成了完整Agent的搭建。

自从2023年11月首届开发日以来,短短两年,OpenAI开发者规模已经从200万增长到400万,翻了1倍!

ChatGPT周活也从1亿暴增超8亿,翻了8倍!

现在,OpenAI API每分钟都有近60亿token产生,相比此前的3亿token,翻了20倍!

这些里程碑的数字不仅代表增长,更意味着AI正在成为新的技术基础设施。

OpenAI未来的野心,全部藏在了这场发布会的四大核心发布中。

ChatGPT,下一代「操作系统」

首先,奥特曼带来首个重磅发布叫做——Apps SDK。

意味着你可以在ChatGPT直接调用其他APP。借助Apps SDK,ChatGPT可以集成各种应用。

这个功能完全反映了OpenAI的野心!

奥特曼想把ChatGPT打造成未来的操作系统。

现在我们的应用都是运行在MacOS、Windows、Linux等操作系统上。

未来,ChatGPT将成为更上级的「操作系统」,即使是专业APP,都可以直接「运行」在ChatGPT里。

ChatGPT的目标是成为「操作系统级」的入口,而不仅仅是一个「应用」!

OpenAI的应用CEO Fidji Simo盛赞这个功能将「无法想象」,非常期待开发者打造的应用。

奥特曼想把ChatGPT变成每个人的「默认界面」,就像曾经Windows桌面是每个人的「默认界面」一样。

目前公布支持的APP包括:Booking.com、Canva、coursera、Expedia、Figma、Spotify和Zillow。

OpenAI的软件工程师Alexi现场展示了如何在ChatGPT直接调用这些外部应用。

比如只需要输入「Coursera」,ChatGPT就能自动识别并调用Coursera的功能。

可以直接在ChatGPT中要求「Canva」制作海报,而不需要额外跳转。

类似的,可以直接在ChatGPT中使用Zillow查询周边房价,并使用Zillow的UI来直接呈现。

奥特曼承诺,更多应用即将上线。

一键拖拽,8分钟搭一个Agent

第二个全新的功能就是此前剧透的可视化智能体构建平台。

新功能名为AgentKit,是面向开发者和企业的一整套构建、部署和优化智能体的工具。

AgentKit包含三个工具:

  • Agent Builder:可视化画布

  • Connector Registry:管理数据和工具如何连接

  • ChatKit: 嵌入定制聊天界面的工具包

Agent Builder是一个全新的可视化拖拽平台,AI智能体的构建流程就像搭积木一样简单!

ChatKit可以生成各种各样的聊天工具,提供独一无二的Chat体验。

此外,OpenAI这次还提供了评估智能体能力的Eval指标。

通过四个方面,数据集、跟踪评分、自动化提示和第三方模型支持,来评估新建智能体的能力。

关于如何定义Agents,什么是智能体的定义,奥特曼在这次大会也给出了一个答案:

「能够为你工作的系统」都可以称为智能体,Agents!

奥特曼现场展示了Albertsons如何构建智能体来分析销量。

比如,可以直接让ChatGPT出一个提高冰激淋销量的方案。

OpenAI平台体验部门的Christina Huang现场直播展示了,如何只用8分钟就构建一个完整的智能体!

使用Agent Builder无需写任何一行代码,全程只需要拖拽和参数配置。

现在Agent Builder功能已经在OpenAI Platform网站上线。

简单体验了下,构建过程非常的丝滑。

进入开发者平台,点击左侧的「Agent Builder」即可使用。

构建后,点击右上角Evaluate即可开始对新建智能体的评估。

不写一行代码,打造爆款APP

除了ChatGPT原生应用和智能体,AI在软件开发上,已带来颠覆性的变革。

谁曾想,如今,OpenAI内部每周70%的PR都由Codex完成。

就比如,在Codex加持下,拖放搭建智能体工具从0开发仅用6周完成。

奥特曼称,我们正进入一个全新时代,任何有想法的人,都能为自己、家人、社区构建一款应用。

在此,他举了几个鲜活的、发生在每个人身边的案例——

一位89岁退休日本老人,用ChatGPT自学编程为老年用户开发了11款iPhone应用;西班牙的一位老人和流媒体成员,借助ChatGPT、Sora等,帮人们重拾记忆;

在ASU医学院,基于ChatGPT搭建的虚拟患者应用,帮助学习模拟练习如何和患者沟通;还有在法国凡尔赛宫,官方基于Realtime API打造的一款APP,让游客与艺术品和雕塑进行实时对话。

重点来了,今天起OpenAI Codex结束预览,正式进入通用可用阶段。

自今年初首次发布,到GPT-5 Codex的迭代后,Codex的每日消息量增长10倍,自发布处理了超40万亿token。

这一次,新增功能包括:Slack集成、Codex SDK、企业控制。

目前,思科在内部部署Codex后,代码审查速度提升50%,项目平均周期从数周缩短至数天。

现场,OpenAI开发者负责人Romain Huet带来了「舞台灯光控制器」的实时互动演示。

设计原型非常简单,一个控制面板——左侧是摄像头画面,右侧排列操作按钮。

全程无需手写一行代码,Codex快速生成一个功能齐全的界面。

「如何在Node.js中控制索尼FR7相机?」

面对C++ SDK的复杂性,Codex提出了更加优雅的解决方案——基于VISC协议集成控制功能。

几分钟内,Codex不仅生成了Node服务器代码,还解析了相机所需的UDP数据包,甚至发现了特定型号相机所需的特殊头部信息。

仅仅用按钮控制相机还不够,下一步,让Xbox无线手柄实现相机控制。

通过Codex IDE扩展发送指令,Codex便会迅速制定计划、分析文件,自动识别Xbox的输入逻辑,并将摇杆映射为控制的最佳方式。

运行服务器,现场摄像头画面屏幕闪现,台下所有人挥手打招呼。

更令人兴奋的是,它还集成了语音交互功能。

通过Codex的Realtime API和智能体语音,可以将自然语言引入这款应用。

只需说一句,「将灯光聚焦到观众席」,Codex便通过MCP服务器控制会场灯光系统,瞬间点亮观众席。

最后,Romain还用Codex SDK拍了一张全体照片,实现了一个「电影式结尾」——演职员表,将现场所有参会者的名字动态呈现。

这一切,全部通过语音指令完成。

Codex GA(General Availability)开放,标志着软件工程未来全新可能。

奥特曼现场表示,「它将最复杂的编码难题简化为自然语言指令,唯一的限制就是你的想象力」。

三大API,Sora 2也上线了

最后,奥特曼带来了三大API——GPT-5 Pro、gpt-realtime-mini、Sora 2

开发者们可以抢先一步,享用最强GPT-5 Pro智能,其在指令遵循方面能力大幅提升,体验更优。

在处理那些高精度、深度推理复杂任务,GPT-5 Pro更拿手,尤其是在金融、法律、医疗保健等众多行业。

如今,OpenAI API即可支持GPT-5 Pro的调用。

它的训练截止时间是2024年9月30日,400k上下文窗口,最大支持272k token输出。

输入价格:15美元/百万token,输出价格:120美元/百万token。目前支持文本、图像输入,仅文本输出。

最新的API定价,再次刷新了价格天花板。

GPT-5 Pro输入价格是GPT-5 15倍,输出价格是GPT-5 12倍。

同时,OpenAI还在API中发布了一款语音模型——gpt-realtime-mini。

这是两个月前高级语音模型的缩小版,成本降低了70%,但语音质量和性能保持不变。

奥特曼称,「就我个人而言,我认为语音将成为人们与 AI 交互的主要方式之一。而这次发布正是迈向这一现实的一大步」。

值得一提的是,几天前刚刚上线的Sora 2,预览版的API也正式上线。

视频长度、宽高比、分辨率,全程可控。

这意味着,任何一款APP直接可以用Sora API,生成出令人惊叹的视频。

可控性,是Sora 2最大的优势。比如,拍摄iPhone视图,Sora即可扩展成一个全景电影宽镜头。

首次实现音画同步,Sora 2直出背景、环境音效。

甚至,人们还可以将现实世界的片段融入Sora。比如,将自家狗照片上传,就可以瞬间为它造出「赛博狗友」。

在电商广告中,Sora 2还可以做概念开发。

一个用户案例是,OpenAI联手MATTEL,将创意师的产品创意瞬间变为现实。

演讲的最后,奥特曼激动表示,「我们正见证一个前所未有的时代」。

曾几何时,开发一款软件需要数月,甚至数年的周期。

而今天,有了AI,一个想法可以在几分钟内落地成型。

开发者不再需要一个庞大的团队,只需一个好的创意,就能超越以往的速度,将灵感变为现实。

我们的愿景,是让AI真正为每一个人所用。

而这个愿景,离不开你们每一个人的参与。

参考资料:
https://www.youtube.com/watch?v=hS1YqcewH0c
https://x.com/OpenAI/status/1975242488056324159

<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652632625&amp;idx=1&amp;sn=d0f3af2879c09804fb46eff943b367bb&amp;chksm=f0c5918d124cc31e4f65f077322626355c727e72e0a11a87fcb5c047f074b70eb3e03c2fe6ea&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/83671/zNFafXsTSS&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们