动态列表

  • 刚刚,ChatGPT支持MCP了!一句Prompt即可全自动化
  • 通用Agent是伪命题?昆仑万维方汉现场拆解:垂直推理才是胜负手|新智元十年峰会
  • 文心X1.1三大能力狂飙,海内外实测还挺惊艳!
  • 超越90%城市规划师!清华、MIT等提出人机协作新范式 | Nature子刊
  • 慕尼黑车展,当冷静遇上冷静
  • 继首创“AI打赏”服务之后,支付宝再推国内首个“AI付”
  • 蚂蚁百宝箱新品Tbox超级智能体亮相外滩大会,5分钟即可完成专业教学素材
  • 量子宇宙模拟竞赛开启:量子计算机可以模拟并阐明复杂物理现象
  • 3000亿美元OpenAI大单,让世界首富位置换人了
  • 攻克大模型「表格盲区」!ST-Raptor框架发布,实现复杂半结构化表格的精准理解与信息抽取
  • 港大马毅外滩大会演讲:人工智能应从“黑箱”走向“白箱”
  • 兼顾准确率与可解释性,DeepSEA实现抗生素耐药蛋白注释范式转变
  • 交互扩展时代来临:创智复旦字节重磅发布AgentGym-RL,昇腾加持,开创智能体训练新范式
  • RewardDance:字节跳动提出视觉生成奖励扩展新范式,破解“奖励劫持”难题
  • 刚刚,Thinking Machines Lab首次发长文,揭开LLM推理不确定性真相
  • 英伟达的AI已经开始接管整个项目了?SATLUTION自主进化代码库登顶SAT竞赛
  • 大模型智能体不止能写代码,还能被训练成白帽黑客
  • 高德扫街榜,能不能做成中国的「Google Map」?
  • 开启MPV家庭新时代,魏牌高山7正式启动预售
  • ACL最佳论文幕后的北大人!北大张铭带出顶会常胜军和百亿CEO天团|新智元十周年峰会
  • 刚刚,这款Agent浏览器力压OpenAI,72%成功率全球第一!还能免费用
  • =COPILOT()函数横空出世!AI自动写公式效率起飞,网友:让Excel再次伟大
  • 当智能醒于物理世界,英伟达副总裁: 下一个十年属于物理AI!|新智元十周年峰会
  • 刚刚,英伟达祭出下一代GPU!狂飙百万token巨兽,投1亿爆赚50亿
  • 00后挑大梁!近20国选手激战外滩大会,AI科创赛三赛道冠军诞生
  • CoRL 2025 | 港大InfoBodied AI团队首发具身表征新范式,构建任务自适应的感知框架
  • 英伟达下一代GPU登场,Rubin CPX一次推理数百万Token,网友:这是头野兽
  • 谷歌AI新里程碑:一个能「做研究」的系统诞生了,用LLM+树搜索编写专家级软件
  • 爱诗科技完成6000万美元B轮融资,阿里巴巴领投,达晨财智、深创投、北京市AI基金、巨人网络、Antler等跟投
  • 当人工智能「看见」量子世界:AI如何改变对复杂量子系统的认知,南洋理工、上交等发布量子系统学习综述
  • 院士领衔!从智能算网到司法AI:顶尖学者直播解读AI与工程前沿趋势
  • SFT真不如RL?MIT团队抛出“RL的剃刀”,砍掉遗忘直通终身学习
  • DeepSeek、Gemini都不行?AgenTracer锁定多智能体“背锅侠”,8B小模型反超闭源巨模
  • 北京内推 | AMD北京AI算法团队招聘模型量化/剪枝算法实习生(可远程)
  • AI应用元年,这场标杆赛事见证了中国创新速度与野心
  • AI胡说八道这事,终于有人管了?
  • 人人都能炼专属Agent,上海交大开源端侧Agent全栈工具链,真实场景性能超GPT-5!
  • TPAMI 2025 | H2OT:分层沙漏型Tokenizer,重塑高效视频姿态Transformer
  • 史上最贵「打工皇帝」!马斯克解锁1万亿美金工资,拢共分几步?
  • 500 块的「电子宠物」,治好了我的「路怒症」|New Things
  • 苹果发布会:耳机测心率、手表听音乐、iPhone Air超级薄
  • 5999 元起,苹果发布eSIM、超薄 iPhone;王腾再辟谣离职原因谣言;反恶性补贴,主要外卖平台被约谈|极客早知道
  • 不到10天,国产「香蕉」突袭!一次7图逼真还原,合成大法惊呆歪果仁
  • 再也不怕面瘫脸!YouTube黑科技:AI帮你「永久微笑」,连僵尸都咧嘴笑
  • OpenAI真正王牌,不是Ilya!刚刚,奥特曼罕见致谢这两人
  • 缔造OpenAI的秘密,竟只有一个词!新智元十年峰会圆桌,七位大咖激辩
  • Hinton预言失灵?掌握AI技能涨薪23%,比读硕士更赚钱
  • 最薄 iPhone 登场,eSIM 正式落地|苹果秋季发布会新品回顾
  • 文心新出的推理大模型,给了我们信心
  • SFT远不如RL?永不过时的剃刀原则打开「终身学习」大模型训练的大门
  • 从第一性原理出发的RAG推理新范式来了,蚂蚁DIVER登顶权威基准
  • 击败多个行业巨头,优必选自研人形机器人最强大脑 Thinker 斩获全球四项第一
  • 字节跳动发布 Seedream 4.0 图像创作模型,豆包、即梦可免费体验
  • 从科幻到产业元年 | 「脑机接口」系统综述发布:全景解析理论、技术、挑战、趋势
  • 硅谷也996实锤了?AI的火,烧掉了硅谷的周末
  • DPad: 扩散大语言模型的中庸之道,杜克大学陈怡然团队免训推理加速61倍
  • Altman亲自发博客点赞,这两大杰出人才是谁?
  • 自变量机器人完成近 10 亿元 A+ 轮融资,多元资本押注共同布局具身智能未来
  • 不止综述!多模态大模型持续学习全链路:Benchmark、方法与Codebase一网打尽
  • 报名启动!西湖大学云谷青年学者论坛·人工智能分论坛诚邀全球英才
  • ICML 2025 | 别再只拼CoT了!不完备信息下的主动推理,LLM普遍掉线
  • 科研实习 | 北京大学计算机学院潘亮铭老师课题组招收NLP/大模型方向科研实习生
  • 时空壶发布 W4:用「硬核」技术,打赢一场 AI 翻译的「标准」之战
  • Science | 西奈山伊坎医学院新AI算法为1600种变异定量「风险」,解析疾病外显率难题
  • TPAMI 2025 | IGEV++:迭代多范围几何编码,刷新立体匹配技术新高度
  • 原来你是这样的外滩大会!
  • 小米通报王腾因泄密被辞退,本人发微博回应;传 IPO 估值 500 亿,宇树回应 ;辛顿自曝被女友用 AI 分手 | 极客早知道
  • Hinton自曝:前女友提分手,用ChatGPT列出自己「七宗罪」
  • 从「会说」迈向「会做」,LLM下半场:Agentic强化学习范式综述
  • 字节Seedream 4.0将全量开放!抢先评测来了,我们摸索出AI生图20种「邪修」玩法
  • 全球图生视频榜单第一,爱诗科技PixVerse V5如何改变一亿用户的视频创作
  • 扎克伯格的豪赌初见成效?Meta新方法让LLM长上下文处理提速30倍
  • 具身VLA后训练:TeleAI提出潜空间引导的VLA跨本体泛化方法
  • 上海AI Lab重磅综述:AI实现自主科学发现时代已经到来
  • 6 个月估值暴涨 5 倍突破 100 亿美元,三个「00后」逼急 Scale AI
  • 深圳内推 | 腾讯音乐天琴实验室招聘音乐生成算法研究员(社招/校招)
  • 给RL装上“防抖器”!GRPO稳化版来了:更高熵、更低KL、更稳更新
  • Focal Loss也能无监督?北大×港中文团队用“双重不确定性优化”提升鲁棒3D感知
  • 导师放养真的会毁掉一个人……
  • 上汽通用五菱与华为深化合作,推出首款车型宝骏华境S
  • IEEE TPAMI | M²Diffuser: 让机器人学会“脑补”,在复杂3D场景中实现精准移动操作
  • 国行版苹果 AI 推迟至年底上线;视频平台广告被曝「偷时间」;美国计划限制进口中国无人机和重型载具 | 极客早知道|极客早知道
  • 16岁创业,22岁做成百亿独角兽!3位高中同学帮大厂训AI年入1亿美金
  • 《2025新智元ASI前沿趋势报告》全文
  • 一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发
  • 苹果端侧AI两连发!模型体积减半、首字延迟降85倍,iPhone离线秒用
  • Claude不让我们用!国产平替能顶上吗?
  • SceneSplat: 基于3DGS的场景理解和视觉语言预训练,让3D高斯「听懂人话」的一跃
  • 慕尼黑车展 2025前瞻:中国队组团出海,BBA 走向「新」时代
  • 国内外AI大厂重押,初创梭哈,谁能凭「记忆」成为下一个「DeepSeek」?
  • 斯坦福:优化器「诸神之战」?AdamW 凭「稳定」胜出
  • 字节跳动Seed推出「机器人大脑」Robix:让机器人学会思考、规划与灵活互动
  • 浙大提出SSGaussian:注入语义与结构灵魂的3D风格迁移,让高斯溅射场景化身艺术品
  • 苹果 iPhone 17 系列规格已全被曝光;Anthropic 全面封杀中国公司接入;今夜将迎来「血月」月全食|极客早知道
  • OpenAI重组GPT-5「灵魂」团队!亚裔女负责人遭调离,罕见自曝AI幻觉祸首
  • 设计师大解放!清华发布「建筑平面图」自动生成模型 | ACL'25
  • 谁不用谁亏!Karpathy吹爆GPT-5:10分钟编码完胜Claude一小时,奥特曼秒回感谢
  • 震撼实锤!清华姚班校友揭「1.4×加速」陷阱:AI优化器为何名不符实?
  • Anthropic被作家告了,违规下载700万本书,15亿美元和解了
  • 英伟达的局:狂撒15亿美元,从Lambda那租到了搭载自家AI芯片的GPU服务器
  • OpenAI罕见发论文:我们找到了AI幻觉的罪魁祸首
  • 00后以1.1亿美金「掀桌」,硅谷AI将书写影视新传奇 终结制片旧时代
  • 任意骨骼系统的模型都能驱动?AnimaX提出基于世界模型的3D动画生成新范式
  • IEEE TPAMI 2025| PointGST:参数量仅0.67%,精度首破99%,三维点云处理迎来谱域新范式!
  • ICCV 2025 | MOSEv2 全新亮相,第七届 LSVOS 挑战赛正式开启!
  • 华为新问界 M7,6 小时订单破 13 万;等 eSIM,iPhone17 Air 首发无国行;特斯拉拟给马斯克 1 万亿薪酬
  • 力压哈佛MIT!北交大、清华勇夺2025国际大学生程序设计竞赛金牌
  • 长视频生成可以回头看了!牛津提出「记忆增稳」,速度提升12倍
  • 0.01%参数定生死!苹果揭秘LLM「超级权重」,删掉就会胡说八道
  • 今天,特朗普闭门宴请了大半个硅谷的CEO,马斯克老黄没来
  • 追觅给洗地机,加了一双「灵巧手」
  • 被网友逼着改名的谷歌Nano Banana,正在抢99%时尚博主的饭碗
  • 不止会动嘴,还会「思考」!字节跳动发布OmniHuman-1.5,让虚拟人拥有逻辑灵魂
  • 外滩大会主论坛阵容揭幕!顶级学者、产业领袖和青年创新力量共话未来
  • 第一家 AI 浏览器公司,卖了 43 亿!
  • Nano Banana爆火之后,一个神秘的「胡萝卜」代码模型又上线了
  • KDD 2025 | 图异常基础模型来了:跨域零样本、少样本微调,原型残差全拿下
  • 推理加持的排序SOTA!把“召回+相似度”写进RL,文档排序更稳更准
  • 博士申请 | 香港中文大学(深圳)游宇宁老师招收人工智能+生物医药全奖博士/实习生
  • 透明度罕见!百川公开M2完整技术报告,强化学习新范式引发行业关注
  • 沉寂一个月,openPangu性能飙升8%!华为1B开源模型来了
  • 多模态大模型持续学习系列研究,综述+Benchmark+方法+Codebase一网打尽!
  • TPAMI重磅综述:一文读懂人类动作视频生成的五大阶段与三大多模态技术
  • 拓展天文学认知边界,Google DeepMind用AI助力LIGO,填补宇宙演化史缺失环节
  • 拍我AI限时免费6天!手办、宠物、奇幻创意随你生成不限次!

百度CTO王海峰:AGI曙光已现,Scaling Law仍有效|新智元十周年峰会



  新智元报道  

编辑:编辑部
【新智元导读】十年间,从AlphaGo到AGI曙光初现,AI一路狂飙。新智元十周年峰会现场,百度CTO王海峰倾力分享,AI正加速解锁「全面」与「通用」的双重突破。值得一提的是,在百度内部,超45%每日新增代码由AI自动生成。

一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发

2025年,AI如同一颗「超新星」,穿越时间和空间的界限,点燃了文明的无限可能。

它,不再是冰冷的算法,而是化作宇宙的脉动,成为「第四次工业革命」的星际引擎。

过去9个月,我们见证了,大模型飞速进化,超级应用大批涌现。

年初,o3横空出世,标志着LLM正式进入「推理时代」。

随后,谷歌Gemini 2.5 Pro、xAI Grok 4、OpenAI GPT-5等国内外大模型相继诞生,再次为Scaling Law输血续命。

现如今,AI的智能水平,已达到了人类博士级别。

史上第一次,OpenAI和谷歌Gemini 2.5 Deep Think,双双夺下了国际奥赛IMO 2025冠军。

上半年,百度发布了文心大模型4.5、文心大模型X1、文心大模型4.5 Turbo及文心大模型X1 Turbo四款模型。

半个月前,谷歌Nano Banana发布后瞬间成为顶流,一句话P图,被全网整出各种花活儿。

老照片修复、等距图标位置、3D手办等,全部拿捏。甚至,有网友直呼,「PS终结者来了」。

这一年,AI的传奇仍在续写,而我们,都是这场星际旅程的见证者。

在新智元十周年庆典上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰以「通用人工智能的曙光」为题,献上了一场连接历史与未来的思想盛宴。


AI十年蝶变
从AlphaGo到大模型爆发

演讲伊始,王海峰便将思绪引向了十年前——2015年。

这一年,不仅是人工智能发展的重要转折点,更是新智元意义非凡的起点。

正是在2015年,新智元正式成立,并逐渐成长为广大AI从业者与爱好者,关注行业动态、把握技术前沿的核心平台。

王海峰回忆道,「早在新智元成立之前,杨静女士就建了一个群叫『静沙龙』,当时我加入了这个群,从中了解到一些行业信息」。

有了新智元以后,越来越多的人从这个平台了解到行业的发展。


可以说,在过去波澜壮阔的十年里,新智元真正见证了AI领域的飞速跃进。


同样在这一年,AI如汹涌浪潮般席卷全球,开启了一个全新的智能时代。

2015年10月,谷歌AlphaGo以5:0的比分,击败了人类职业棋手——「欧洲围棋冠军」樊麾(Fan Hui)。

这是首次,AI在没有让子的情况下完胜,打破了此前业内「AI十年内无法战胜人类围棋手」的预言。

图右:2016年,AlphaGo击败世界顶尖「九段」棋手李世石,引发全世界轰动

紧接着11月,谷歌TensorFlow正式开源。

自此,它成为ML框架的基石,支撑起整个深度学习生态的蓬勃发展。

12月,奥特曼、马斯克等人一同创办了OpenAI,如今已经成为改变全球AI格局的巨头。

同样在这一年,何恺明等人提出的ResNet(残差神经网络),在ImageNet挑战赛上成功夺冠。

论文地址:https://arxiv.org/pdf/1512.03385

这些里程碑式的事件,将AI从抽象概念变成可触达的现实。

而在中国,百度作为AI领域的先行者,也在2015年取得了丰硕的成果:

  • 自研深度学习框架,并于2016年开源

  • 率先将大规模神经网络机器翻译推向大众,领先谷歌超一年

  • 小度系列的前身度秘上线

  • 自然语言处理、搜索、语音、视觉等领域,全面拥抱深度学习

拉长历史的镜头,人工智能的探索,早于AI一词的诞生。

早在1940年代计算机问世之初,人类便开始播下了AI的种子——1947年,机器翻译的构想首次提出。

同期,神经网络雏形与图灵测试如星火初现。1956年,达特茅斯会议上,人工智能这一术语正式诞生。

从此,AI的航程跌宕起伏。每当新技术涌现时,人们的期待如热潮高涨;若未达预期时,则又跌入谷底。

然而,近十年,这条AI发展曲线一路上扬,原因显而易见。

LLM等前沿技术的突破如泉水般涌出,落地应用如繁花般绽放,真正展现了AI在人类生产实践中的价值。

如果用一句话解释,人工智能是什么?

王海峰给出的定义是,「人工智能的目标是——模拟、延伸和扩展人的智能」。这不仅仅是技术追求,更是人类对自身潜力的无限探索。

七十多年的发展,AI经历了四代技术演进:人工规则、统计机器学习、深度学习、大模型。

大模型与深度学习的差别,在于其超强「通用性」。

一个基础大模型完成训练后,就可以解决不同场景的问题。甚至,只需微调就能适配新的场景。

这种从「人工」到「自动」,从「算法通用」到「模型通用」的飞跃,让AGI的曙光愈发清晰。


AGI曙光已现,全面觉醒


AGI的定义因人而异,但王海峰认为,「技术的通用性」「能力的全面性」是两个核心。

换句话说,当AI技术越来越通用,能力越来越全面,它就越接近AGI。


通用性


「通用性」,可以从任务、语言、模态,以及场景等维度来阐释。

· 跨任务

十年前,百度推出度秘(Duer)时,后台依赖多种NLP技术,如理解、交互等。

彼时,NLP领域细分无数子方向——词法、句法、语义、识别、抽取、摘要、问答等等,皆需专属的算法与模型。

如今,LLM如同一把万能的钥匙,一个模型即可解决所有任务,且效果超越以往,展现出无与伦比的任务通用性。

· 跨语言

自然语言,是人类「沟通」与「思维」的载体,灵活多义,且有各种歧义,分析起来比较困难。

形式语言如Python、C++等结构明确,一段正确编写的形式语言,通常可被唯一解释、编译和执行。

如今,LLM就像一个黏合剂,将自然语言与形式语言融于一体。

一个模型即可理解中文、英文等自然语言。同时,也可生成可执行的代码,架起了从「思考」到「执行」的桥梁。

至今,Karpathy账号上方还Pin着这句话:英文是最热门的编程语言

· 跨模态

过去,语言、语音、视觉领域的研究各自为战,鲜有交集。

而多模态大模型的出现,真正将这些领域统一,大幅提升了模型的通用性。

以谷歌Gemini 2.5 Pro为代表,一个原生多模态模型,可同时处理文本、图像、音频、视频、代码等多种信息形式。

再来看百度,最新数字人技术,基于文心4.5 Turbo,模型不仅能输出剧本、台词,还能协调语音、表情、动作等多模态内容。

它像一位真正的导演一样,同时兼顾驱动多模态的协同。

由此,数字人的「神、形、音、容、话」才能达到高度的统一。

一个案例中,数字人老罗直播间卖鸡蛋,语言、动作、神情,甚至与助手的配合,做到了比真人的表现还好。

· 跨场景

百度飞桨深度学习框架+文心系列模型,已广泛应用于搜索、翻译、医疗、金融、工业等多个领域。

场景通用性,覆盖了各行各业。

全面性


AI的全面性,是模拟、延伸扩展人类智能的关键。

人类智能涵盖了诸多方面,如感知、推理、创造等等,每个人都能列出一长串描述智能的词语。

在王海峰看来,理解、生成、逻辑、记忆是其中的核心基础能力,这四项能力越强,越接近通用人工智能。

它们如同AI的四根支柱,这些能力增强的同时,其他能力也会随之提升。

就以文心X1 Turbo为例,让它以「一条中轴线,串起北京的历史」为主题进行创作。

它首先会理解需求,然后梳理文章逻辑结构、挖掘相关素材,最终输出文采斐然的文章。

其思考过程清晰可见,展现了理解、逻辑、记忆、生成的完美协同。

随着这四大基础能力的增强,AI综合实力会跟着「水涨船高」,我们离真正的AGI也就越来越近了。


每日新增代码,超45%由AI生成


AI之所以具备了「通用性」和「全面性」,背后一定离不开「AI时代的技术栈」——算力、框架、模型和应用。

与传统IT技术栈相比,AI时代以「芯片」为基础的算力层依然是基石,中间新增了两层核心。

以百度为例,昆仑芯片提供算力支持,飞桨与文心构建技术中枢,最终支撑AI的规模化落地。

截至目前,百度生态已凝聚了超2300万开发者,服务了76万家企业,从侧面印证了AI生态的繁荣。

AI,是第四次工业革命的核心驱动力量。

与前三次革命一样,其核心技术都具备了强大的通用性,并逐步实现了标准化、自动化、模块化。

而如今,通过深度学习框架和大模型,AI正加速进入「工业大生产」阶段,推动技术与产业的进步。

在应用层面,王海峰还分享了多个生动的案例:

  • 翻译:百度翻译支持203种语言,兼具审校、润色、术语查证功能

  • 代码生成:度内部每日新增代码,超45%由大模型生成,且比例持续攀升

还有在工业设计中,AI辅助仿真大幅提升效率;在电力场景中,为南方电网处理海量知识、故障维护,实现创新减负。

演讲尾声,王海峰再次强调,「Scaling Law依然有效,其影响正从预训练、后训练迁移至推理阶段」

大语言模型潜力持续释放,多模态模型日趋成熟,智能体应用正加速普及。

可以预见的是,AI的技术飞跃,终将推动产业和社会的持续进步。

通用人工智能的曙光已现,它不仅在重塑技术格局, 更在重构人类文明的未来。

这是一场,关乎我们每一个人的变革。


<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652626662&amp;idx=1&amp;sn=257429470acf9be6413bf54aa6dda69b&amp;chksm=f084f9a2b5428f9974d8130dcfc1047fc480e39298e632afb86464a48180df65610da8863ef5&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/83671/bDOXOgm9NY&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们