动态列表

刚刚，ChatGPT支持MCP了！一句Prompt即可全自动化
通用Agent是伪命题？昆仑万维方汉现场拆解：垂直推理才是胜负手｜新智元十年峰会
文心X1.1三大能力狂飙，海内外实测还挺惊艳！
超越90%城市规划师！清华、MIT等提出人机协作新范式 | Nature子刊
慕尼黑车展，当冷静遇上冷静
继首创“AI打赏”服务之后，支付宝再推国内首个“AI付”
蚂蚁百宝箱新品Tbox超级智能体亮相外滩大会，5分钟即可完成专业教学素材
量子宇宙模拟竞赛开启：量子计算机可以模拟并阐明复杂物理现象
3000亿美元OpenAI大单，让世界首富位置换人了
攻克大模型「表格盲区」！ST-Raptor框架发布，实现复杂半结构化表格的精准理解与信息抽取
港大马毅外滩大会演讲：人工智能应从“黑箱”走向“白箱”
兼顾准确率与可解释性，DeepSEA实现抗生素耐药蛋白注释范式转变
交互扩展时代来临:创智复旦字节重磅发布AgentGym-RL，昇腾加持，开创智能体训练新范式
RewardDance：字节跳动提出视觉生成奖励扩展新范式，破解“奖励劫持”难题
刚刚，Thinking Machines Lab首次发长文，揭开LLM推理不确定性真相
英伟达的AI已经开始接管整个项目了？SATLUTION自主进化代码库登顶SAT竞赛
大模型智能体不止能写代码，还能被训练成白帽黑客
高德扫街榜，能不能做成中国的「Google Map」？
开启MPV家庭新时代，魏牌高山7正式启动预售
ACL最佳论文幕后的北大人！北大张铭带出顶会常胜军和百亿CEO天团｜新智元十周年峰会
刚刚，这款Agent浏览器力压OpenAI，72%成功率全球第一！还能免费用
=COPILOT()函数横空出世！AI自动写公式效率起飞，网友：让Excel再次伟大
当智能醒于物理世界，英伟达副总裁: 下一个十年属于物理AI！｜新智元十周年峰会
刚刚，英伟达祭出下一代GPU！狂飙百万token巨兽，投1亿爆赚50亿
00后挑大梁！近20国选手激战外滩大会，AI科创赛三赛道冠军诞生
CoRL 2025 | 港大InfoBodied AI团队首发具身表征新范式，构建任务自适应的感知框架
英伟达下一代GPU登场，Rubin CPX一次推理数百万Token，网友：这是头野兽
谷歌AI新里程碑：一个能「做研究」的系统诞生了，用LLM+树搜索编写专家级软件
爱诗科技完成6000万美元B轮融资，阿里巴巴领投，达晨财智、深创投、北京市AI基金、巨人网络、Antler等跟投
当人工智能「看见」量子世界：AI如何改变对复杂量子系统的认知，南洋理工、上交等发布量子系统学习综述
院士领衔！从智能算网到司法AI：顶尖学者直播解读AI与工程前沿趋势
SFT真不如RL？MIT团队抛出“RL的剃刀”，砍掉遗忘直通终身学习
DeepSeek、Gemini都不行？AgenTracer锁定多智能体“背锅侠”，8B小模型反超闭源巨模
北京内推 | AMD北京AI算法团队招聘模型量化/剪枝算法实习生（可远程）
AI应用元年，这场标杆赛事见证了中国创新速度与野心
AI胡说八道这事，终于有人管了？
人人都能炼专属Agent，上海交大开源端侧Agent全栈工具链，真实场景性能超GPT-5！
TPAMI 2025 | H2OT：分层沙漏型Tokenizer，重塑高效视频姿态Transformer
史上最贵「打工皇帝」！马斯克解锁1万亿美金工资，拢共分几步？
500 块的「电子宠物」，治好了我的「路怒症」｜New Things
苹果发布会：耳机测心率、手表听音乐、iPhone Air超级薄
5999 元起，苹果发布eSIM、超薄 iPhone；王腾再辟谣离职原因谣言；反恶性补贴，主要外卖平台被约谈｜极客早知道
不到10天，国产「香蕉」突袭！一次7图逼真还原，合成大法惊呆歪果仁
再也不怕面瘫脸！YouTube黑科技：AI帮你「永久微笑」，连僵尸都咧嘴笑
OpenAI真正王牌，不是Ilya！刚刚，奥特曼罕见致谢这两人
缔造OpenAI的秘密，竟只有一个词！新智元十年峰会圆桌，七位大咖激辩
Hinton预言失灵？掌握AI技能涨薪23%，比读硕士更赚钱
最薄 iPhone 登场，eSIM 正式落地｜苹果秋季发布会新品回顾
文心新出的推理大模型，给了我们信心
SFT远不如RL？永不过时的剃刀原则打开「终身学习」大模型训练的大门
从第一性原理出发的RAG推理新范式来了，蚂蚁DIVER登顶权威基准
击败多个行业巨头，优必选自研人形机器人最强大脑 Thinker 斩获全球四项第一
字节跳动发布 Seedream 4.0 图像创作模型，豆包、即梦可免费体验
从科幻到产业元年 | 「脑机接口」系统综述发布：全景解析理论、技术、挑战、趋势
硅谷也996实锤了？AI的火，烧掉了硅谷的周末
DPad: 扩散大语言模型的中庸之道，杜克大学陈怡然团队免训推理加速61倍
Altman亲自发博客点赞，这两大杰出人才是谁？
自变量机器人完成近 10 亿元 A+ 轮融资，多元资本押注共同布局具身智能未来
不止综述！多模态大模型持续学习全链路：Benchmark、方法与Codebase一网打尽
报名启动！西湖大学云谷青年学者论坛·人工智能分论坛诚邀全球英才
ICML 2025 | 别再只拼CoT了！不完备信息下的主动推理，LLM普遍掉线
科研实习 | 北京大学计算机学院潘亮铭老师课题组招收NLP/大模型方向科研实习生
时空壶发布 W4：用「硬核」技术，打赢一场 AI 翻译的「标准」之战
Science | 西奈山伊坎医学院新AI算法为1600种变异定量「风险」，解析疾病外显率难题
TPAMI 2025 | IGEV++：迭代多范围几何编码，刷新立体匹配技术新高度
原来你是这样的外滩大会！
小米通报王腾因泄密被辞退，本人发微博回应；传 IPO 估值 500 亿，宇树回应；辛顿自曝被女友用 AI 分手 | 极客早知道
Hinton自曝：前女友提分手，用ChatGPT列出自己「七宗罪」
从「会说」迈向「会做」，LLM下半场：Agentic强化学习范式综述
字节Seedream 4.0将全量开放！抢先评测来了，我们摸索出AI生图20种「邪修」玩法
全球图生视频榜单第一，爱诗科技PixVerse V5如何改变一亿用户的视频创作
扎克伯格的豪赌初见成效？Meta新方法让LLM长上下文处理提速30倍
具身VLA后训练：TeleAI提出潜空间引导的VLA跨本体泛化方法
上海AI Lab重磅综述：AI实现自主科学发现时代已经到来
6 个月估值暴涨 5 倍突破 100 亿美元，三个「00后」逼急 Scale AI
深圳内推 | 腾讯音乐天琴实验室招聘音乐生成算法研究员（社招/校招）
给RL装上“防抖器”！GRPO稳化版来了：更高熵、更低KL、更稳更新
Focal Loss也能无监督？北大×港中文团队用“双重不确定性优化”提升鲁棒3D感知
导师放养真的会毁掉一个人……
上汽通用五菱与华为深化合作，推出首款车型宝骏华境S
IEEE TPAMI | M²Diffuser: 让机器人学会“脑补”，在复杂3D场景中实现精准移动操作
国行版苹果 AI 推迟至年底上线；视频平台广告被曝「偷时间」；美国计划限制进口中国无人机和重型载具 | 极客早知道｜极客早知道
16岁创业，22岁做成百亿独角兽！3位高中同学帮大厂训AI年入1亿美金
《2025新智元ASI前沿趋势报告》全文
一图看透全球大模型！新智元十周年钜献，2025 ASI前沿趋势报告37页首发
苹果端侧AI两连发！模型体积减半、首字延迟降85倍，iPhone离线秒用
Claude不让我们用！国产平替能顶上吗？
SceneSplat: 基于3DGS的场景理解和视觉语言预训练，让3D高斯「听懂人话」的一跃
慕尼黑车展 2025前瞻：中国队组团出海，BBA 走向「新」时代
国内外AI大厂重押，初创梭哈，谁能凭「记忆」成为下一个「DeepSeek」？
斯坦福：优化器「诸神之战」？AdamW 凭「稳定」胜出
字节跳动Seed推出「机器人大脑」Robix：让机器人学会思考、规划与灵活互动
浙大提出SSGaussian：注入语义与结构灵魂的3D风格迁移，让高斯溅射场景化身艺术品
苹果 iPhone 17 系列规格已全被曝光；Anthropic 全面封杀中国公司接入；今夜将迎来「血月」月全食｜极客早知道
OpenAI重组GPT-5「灵魂」团队！亚裔女负责人遭调离，罕见自曝AI幻觉祸首
设计师大解放！清华发布「建筑平面图」自动生成模型 | ACL'25
谁不用谁亏！Karpathy吹爆GPT-5：10分钟编码完胜Claude一小时，奥特曼秒回感谢
震撼实锤！清华姚班校友揭「1.4×加速」陷阱：AI优化器为何名不符实？
Anthropic被作家告了，违规下载700万本书，15亿美元和解了
英伟达的局：狂撒15亿美元，从Lambda那租到了搭载自家AI芯片的GPU服务器
OpenAI罕见发论文：我们找到了AI幻觉的罪魁祸首
00后以1.1亿美金「掀桌」，硅谷AI将书写影视新传奇终结制片旧时代
任意骨骼系统的模型都能驱动？AnimaX提出基于世界模型的3D动画生成新范式
IEEE TPAMI 2025｜ PointGST：参数量仅0.67%，精度首破99%，三维点云处理迎来谱域新范式！
ICCV 2025 | MOSEv2 全新亮相，第七届 LSVOS 挑战赛正式开启！
华为新问界 M7，6 小时订单破 13 万；等 eSIM，iPhone17 Air 首发无国行；特斯拉拟给马斯克 1 万亿薪酬
力压哈佛MIT！北交大、清华勇夺2025国际大学生程序设计竞赛金牌
长视频生成可以回头看了！牛津提出「记忆增稳」，速度提升12倍
0.01%参数定生死！苹果揭秘LLM「超级权重」，删掉就会胡说八道
今天，特朗普闭门宴请了大半个硅谷的CEO，马斯克老黄没来
追觅给洗地机，加了一双「灵巧手」
被网友逼着改名的谷歌Nano Banana，正在抢99%时尚博主的饭碗
不止会动嘴，还会「思考」！字节跳动发布OmniHuman-1.5，让虚拟人拥有逻辑灵魂
外滩大会主论坛阵容揭幕！顶级学者、产业领袖和青年创新力量共话未来
第一家 AI 浏览器公司，卖了 43 亿！
Nano Banana爆火之后，一个神秘的「胡萝卜」代码模型又上线了
KDD 2025 | 图异常基础模型来了：跨域零样本、少样本微调，原型残差全拿下
推理加持的排序SOTA！把“召回+相似度”写进RL，文档排序更稳更准
博士申请 | 香港中文大学（深圳）游宇宁老师招收人工智能+生物医药全奖博士/实习生
透明度罕见！百川公开M2完整技术报告，强化学习新范式引发行业关注
沉寂一个月，openPangu性能飙升8%！华为1B开源模型来了
多模态大模型持续学习系列研究，综述+Benchmark+方法+Codebase一网打尽！
TPAMI重磅综述：一文读懂人类动作视频生成的五大阶段与三大多模态技术
拓展天文学认知边界，Google DeepMind用AI助力LIGO，填补宇宙演化史缺失环节
拍我AI限时免费6天！手办、宠物、奇幻创意随你生成不限次！

百度CTO王海峰：AGI曙光已现，Scaling Law仍有效｜新智元十周年峰会

2025-09-11未知作者来源

新智元报道

编辑：编辑部

【新智元导读】十年间，从AlphaGo到AGI曙光初现，AI一路狂飙。新智元十周年峰会现场，百度CTO王海峰倾力分享，AI正加速解锁「全面」与「通用」的双重突破。值得一提的是，在百度内部，超45%每日新增代码由AI自动生成。

一图看透全球大模型！新智元十周年钜献，2025 ASI前沿趋势报告37页首发

2025年，AI如同一颗「超新星」，穿越时间和空间的界限，点燃了文明的无限可能。

它，不再是冰冷的算法，而是化作宇宙的脉动，成为「第四次工业革命」的星际引擎。

过去9个月，我们见证了，大模型飞速进化，超级应用大批涌现。

年初，o3横空出世，标志着LLM正式进入「推理时代」。

随后，谷歌Gemini 2.5 Pro、xAI Grok 4、OpenAI GPT-5等国内外大模型相继诞生，再次为Scaling Law输血续命。

现如今，AI的智能水平，已达到了人类博士级别。

史上第一次，OpenAI和谷歌Gemini 2.5 Deep Think，双双夺下了国际奥赛IMO 2025冠军。

上半年，百度发布了文心大模型4.5、文心大模型X1、文心大模型4.5 Turbo及文心大模型X1 Turbo四款模型。

半个月前，谷歌Nano Banana发布后瞬间成为顶流，一句话P图，被全网整出各种花活儿。

老照片修复、等距图标位置、3D手办等，全部拿捏。甚至，有网友直呼，「PS终结者来了」。

这一年，AI的传奇仍在续写，而我们，都是这场星际旅程的见证者。

在新智元十周年庆典上，百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰以「通用人工智能的曙光」为题，献上了一场连接历史与未来的思想盛宴。

AI十年蝶变

从AlphaGo到大模型爆发

演讲伊始，王海峰便将思绪引向了十年前——2015年。

这一年，不仅是人工智能发展的重要转折点，更是新智元意义非凡的起点。

正是在2015年，新智元正式成立，并逐渐成长为广大AI从业者与爱好者，关注行业动态、把握技术前沿的核心平台。

王海峰回忆道，「早在新智元成立之前，杨静女士就建了一个群叫『静沙龙』，当时我加入了这个群，从中了解到一些行业信息」。

有了新智元以后，越来越多的人从这个平台了解到行业的发展。

可以说，在过去波澜壮阔的十年里，新智元真正见证了AI领域的飞速跃进。

同样在这一年，AI如汹涌浪潮般席卷全球，开启了一个全新的智能时代。

2015年10月，谷歌AlphaGo以5:0的比分，击败了人类职业棋手——「欧洲围棋冠军」樊麾（Fan Hui）。

这是首次，AI在没有让子的情况下完胜，打破了此前业内「AI十年内无法战胜人类围棋手」的预言。

图右：2016年，AlphaGo击败世界顶尖「九段」棋手李世石，引发全世界轰动

紧接着11月，谷歌TensorFlow正式开源。

自此，它成为ML框架的基石，支撑起整个深度学习生态的蓬勃发展。

12月，奥特曼、马斯克等人一同创办了OpenAI，如今已经成为改变全球AI格局的巨头。

同样在这一年，何恺明等人提出的ResNet（残差神经网络），在ImageNet挑战赛上成功夺冠。

论文地址：https://arxiv.org/pdf/1512.03385

这些里程碑式的事件，将AI从抽象概念变成可触达的现实。

而在中国，百度作为AI领域的先行者，也在2015年取得了丰硕的成果：

自研深度学习框架，并于2016年开源
率先将大规模神经网络机器翻译推向大众，领先谷歌超一年
小度系列的前身度秘上线
自然语言处理、搜索、语音、视觉等领域，全面拥抱深度学习

拉长历史的镜头，人工智能的探索，早于AI一词的诞生。

早在1940年代计算机问世之初，人类便开始播下了AI的种子——1947年，机器翻译的构想首次提出。

同期，神经网络雏形与图灵测试如星火初现。1956年，达特茅斯会议上，人工智能这一术语正式诞生。

从此，AI的航程跌宕起伏。每当新技术涌现时，人们的期待如热潮高涨；若未达预期时，则又跌入谷底。

然而，近十年，这条AI发展曲线一路上扬，原因显而易见。

LLM等前沿技术的突破如泉水般涌出，落地应用如繁花般绽放，真正展现了AI在人类生产实践中的价值。

如果用一句话解释，人工智能是什么？

王海峰给出的定义是，「人工智能的目标是——模拟、延伸和扩展人的智能」。这不仅仅是技术追求，更是人类对自身潜力的无限探索。

七十多年的发展，AI经历了四代技术演进：人工规则、统计机器学习、深度学习、大模型。

大模型与深度学习的差别，在于其超强「通用性」。

一个基础大模型完成训练后，就可以解决不同场景的问题。甚至，只需微调就能适配新的场景。

这种从「人工」到「自动」，从「算法通用」到「模型通用」的飞跃，让AGI的曙光愈发清晰。

AGI曙光已现，全面觉醒

AGI的定义因人而异，但王海峰认为，「技术的通用性」和「能力的全面性」是两个核心。

换句话说，当AI技术越来越通用，能力越来越全面，它就越接近AGI。

通用性

「通用性」，可以从任务、语言、模态，以及场景等维度来阐释。

· 跨任务

十年前，百度推出度秘（Duer）时，后台依赖多种NLP技术，如理解、交互等。

彼时，NLP领域细分无数子方向——词法、句法、语义、识别、抽取、摘要、问答等等，皆需专属的算法与模型。

如今，LLM如同一把万能的钥匙，一个模型即可解决所有任务，且效果超越以往，展现出无与伦比的任务通用性。

· 跨语言

自然语言，是人类「沟通」与「思维」的载体，灵活多义，且有各种歧义，分析起来比较困难。

形式语言如Python、C++等结构明确，一段正确编写的形式语言，通常可被唯一解释、编译和执行。

如今，LLM就像一个黏合剂，将自然语言与形式语言融于一体。

一个模型即可理解中文、英文等自然语言。同时，也可生成可执行的代码，架起了从「思考」到「执行」的桥梁。

至今，Karpathy账号上方还Pin着这句话：英文是最热门的编程语言

· 跨模态

过去，语言、语音、视觉领域的研究各自为战，鲜有交集。

而多模态大模型的出现，真正将这些领域统一，大幅提升了模型的通用性。

以谷歌Gemini 2.5 Pro为代表，一个原生多模态模型，可同时处理文本、图像、音频、视频、代码等多种信息形式。

再来看百度，最新数字人技术，基于文心4.5 Turbo，模型不仅能输出剧本、台词，还能协调语音、表情、动作等多模态内容。

它像一位真正的导演一样，同时兼顾驱动多模态的协同。

由此，数字人的「神、形、音、容、话」才能达到高度的统一。

一个案例中，数字人老罗直播间卖鸡蛋，语言、动作、神情，甚至与助手的配合，做到了比真人的表现还好。

· 跨场景

百度飞桨深度学习框架+文心系列模型，已广泛应用于搜索、翻译、医疗、金融、工业等多个领域。

场景通用性，覆盖了各行各业。

全面性

AI的全面性，是模拟、延伸和扩展人类智能的关键。

人类智能涵盖了诸多方面，如感知、推理、创造等等，每个人都能列出一长串描述智能的词语。

在王海峰看来，理解、生成、逻辑、记忆是其中的核心基础能力，这四项能力越强，越接近通用人工智能。

它们如同AI的四根支柱，这些能力增强的同时，其他能力也会随之提升。

就以文心X1 Turbo为例，让它以「一条中轴线，串起北京的历史」为主题进行创作。

它首先会理解需求，然后梳理文章逻辑结构、挖掘相关素材，最终输出文采斐然的文章。

其思考过程清晰可见，展现了理解、逻辑、记忆、生成的完美协同。

随着这四大基础能力的增强，AI综合实力会跟着「水涨船高」，我们离真正的AGI也就越来越近了。

每日新增代码，超45%由AI生成

AI之所以具备了「通用性」和「全面性」，背后一定离不开「AI时代的技术栈」——算力、框架、模型和应用。

与传统IT技术栈相比，AI时代以「芯片」为基础的算力层依然是基石，中间新增了两层核心。

以百度为例，昆仑芯片提供算力支持，飞桨与文心构建技术中枢，最终支撑AI的规模化落地。

截至目前，百度生态已凝聚了超2300万开发者，服务了76万家企业，从侧面印证了AI生态的繁荣。

AI，是第四次工业革命的核心驱动力量。

与前三次革命一样，其核心技术都具备了强大的通用性，并逐步实现了标准化、自动化、模块化。

而如今，通过深度学习框架和大模型，AI正加速进入「工业大生产」阶段，推动技术与产业的进步。

在应用层面，王海峰还分享了多个生动的案例：

翻译：百度翻译支持203种语言，兼具审校、润色、术语查证功能
代码生成：百度内部每日新增代码，超45%由大模型生成，且比例持续攀升

还有在工业设计中，AI辅助仿真大幅提升效率；在电力场景中，为南方电网处理海量知识、故障维护，实现创新减负。

演讲尾声，王海峰再次强调，「Scaling Law依然有效，其影响正从预训练、后训练迁移至推理阶段」。

大语言模型潜力持续释放，多模态模型日趋成熟，智能体应用正加速普及。

可以预见的是，AI的技术飞跃，终将推动产业和社会的持续进步。

通用人工智能的曙光已现，它不仅在重塑技术格局，更在重构人类文明的未来。

这是一场，关乎我们每一个人的变革。

<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652626662&amp;idx=1&amp;sn=257429470acf9be6413bf54aa6dda69b&amp;chksm=f084f9a2b5428f9974d8130dcfc1047fc480e39298e632afb86464a48180df65610da8863ef5&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/83671/bDOXOgm9NY&amp;maxage=1y"  width="1px"></div></div></body></html>

动态列表

百度CTO王海峰：AGI曙光已现，Scaling Law仍有效｜新智元十周年峰会

新智元报道

【新智元导读】十年间，从AlphaGo到AGI曙光初现，AI一路狂飙。新智元十周年峰会现场，百度CTO王海峰倾力分享，AI正加速解锁「全面」与「通用」的双重突破。值得一提的是，在百度内部，超45%每日新增代码由AI自动生成。

类别

资源

联系我们