动态列表

  • AI又封神了!华人新作直出憨豆+《猫和老鼠》,平行宇宙对上戏了
  • AI「逼宫」库克?苹果秘密计划曝光,接班人竟是M芯片之父!
  • 年度最强AI压轴!谷歌Gemini 3.0下周决战OpenAI,前端要下岗了
  • 安谋科技发了一枚 NPU,要把 AIGC 算力提升 10 倍
  • ICLR 2026吃瓜现场:有人用LLM连投4版论文,竟然拿到两个8分?
  • 无人工标注、可持续扩展:AcademicEval推动长文本评测进入“自更新”阶段
  • 宇树完成上市辅导,拟境内IPO;传索尼开发Labubu电影;2699元!原道X小岛秀夫耳机限量发售
  • AAAI 2026 Oral | 清华大学等提出SpatialActor:解耦空间感知,重度噪声下机器人操作鲁棒性暴涨19.4%
  • AI不懂痛苦,却成了你的深夜知己!170位医生教ChatGPT安慰人
  • 一条短信,7年恩怨!奥特曼与马斯克决裂曝出新隐情
  • 不会说英语的母亲,教出了5万亿英伟达CEO!
  • AI「牛顿」来了!北大团队新突破,看一眼数据就能推出物理定律
  • AAAI 2026 Oral | 中科院联合港大提出ARRA:外部视觉表征对齐重塑全局一致性,让自回归大模型充分释放图像生成潜能
  • 1899 元「iPhone 袜子」上架秒光;传华为 Mate80 上 20GB 内存;微信点赞苹果小程序政策
  • 全球最大开源具身大模型!中国机器人跑完马拉松后开始学思考
  • OpenAI拆开AI「黑箱」,终于可以看懂GPT在想什么了
  • LeCun在Meta的「最后一作」
  • 视觉压缩称王?谷歌死守AI黑科技,DeepSeek一夜开源
  • 大疆 OSMO Action 6 体验:完美进化,不止运动
  • iOS 为微信小程序「正名」,腾讯移动生态的新转机
  • WACV 2026 | PALMS+:融合深度基础模型,手机室内导航的技术再突破
  • “全模态”3D视觉基础模型OmniVGGT出炉!即插即用任意几何模态,刷新3D视觉任务SOTA,赋能VLA模型
  • GPT 5.1 发布了,但西方媒体准备「讲好中国故事」
  • AI、游戏双驱动,腾讯「赚麻了」
  • 对话李彦宏:Chatbot 不是一切,我在 AI 上看到了更让人兴奋的未来
  • OpenAI把Transformer训练成「几乎全零」,黑箱首次被彻底揭开
  • 杭州/北京内推 | 阿里淘天算法团队招聘多模态理解方向算法实习生
  • ACL 2025 | 用图结构让RAG学会「记忆与总结」,重塑长上下文理解
  • 传苹果从微信小程序抽成 15%,腾讯回应;特斯拉考虑支持 CarPlay;iPhone Air 成功支持实体卡 |极客早知道
  • 谷歌DeepMind最新论文,刚刚登上了Nature!揭秘IMO最强数学模型
  • ICLR 2026出分,审稿员怒喷「精神病」!DeepMind研究员教你绝地求生
  • GPT-5.1发布当天,文心5.0杀回来了
  • 一句「你还好吗」值40亿?斯坦福博士出走xAI,押注AGI共情力
  • 营收狂飙的「暗面」:Meta成「全球欺诈大本营」?
  • 小鹏科技日「太魔幻」:机器人走猫步,飞行汽车接近量产
  • Roboflow&CMU论文披露RF-DETR细节:首个COCO数据集突破60 AP实时目标检测,速度飙升20倍!
  • AAAI 2026 Oral 中科大联合西工大提出RSKT-Seg:专为遥感打造的高效开放词汇分割框架,推理提速2倍
  • 深度研究智能体真的“懂你”吗?OPPO × 浙大首发个性化深度研究评测基准
  • 博士申请 | 佛罗里达大学计算机系招收NLP/LLM方向全奖博士/实习生
  • DeepSeek罗福莉正式亮相小米AI;「周杰伦概念股」联手宇树造 IP 机器人;乘用车百公里加速不少于5秒
  • 奥特曼下注27岁神秘青年,「复活」世界最顶级实验室
  • AI秒破18世纪「天书」账本!谷歌新模型盲测刷屏全网
  • Llama 4造假丑闻幕后:小扎豪赌143亿,却为中国AI「做了嫁衣」
  • 少年沉迷AI自杀,9岁遭性暗示!这门「孤独生意」,正推孩子入深渊
  • NeurIPS 2025 | 中科院携手快手发布LiveStar:首个“会说话、懂沉默”的直播AI,推理速度提升1.53倍
  • ConsistEdit:重新定义AI视觉编辑,港科大、清华等机构提出MM-DiT注意力控制新方法
  • 北京内推 | 阿里高德地图团队招聘大模型方向算法实习生(可长期/转正)
  • AAAI 2026 | 悉尼科技大学 × 港理工推出 FedVLR:让联邦推荐也能“懂图文”
  • 双十一算力真敢卷!RTX 5090低至0.69元/时,同预算跑更多实验
  • 对话元理智能张帆:为什么「商业强化学习」,才是 AI To B 的新出路
  • 深度复盘:大疆是如何成为影像领域新巨头的?
  • 传李想亲抓人事,华为系高管退出理想;Meta 首席 AI 科学家杨乐昆离职创业;AI 减肥或致饮食失调
  • Nature子刊:太空中建数据中心,无限能源,浙大首次证实可行!
  • 英伟达铁幕之后,谷歌AI芯片已成气候
  • 翻译界的ChatGPT时刻!Meta发布新模型,几段示例学会冷门新语言
  • 硅谷GPU蒙尘,马斯克一言成谶:美国AI被电卡脖子
  • 65岁图灵巨头离职创业!LeCun愤然与小扎决裂,Meta巨震
  • 年产值突破 150 亿,刚毕业的俊男美女涌入「团播」工厂
  • 马斯克想要 1 万亿,何小鹏只想等一句「牛 P」
  • 通往AGI的歧路:上海AI Lab重磅发现,自进化智能体可能“错误进化
  • 全模态到底是不是“1+1>2”?美团UNO-Bench揭示单模态与全模态能力的组合规律
  • 北京内推 | 百度文心一言基座团队模型组招聘大模型方向研究型实习生
  • NeurIPS 2025 | 上交大、南农大提出ADPretrain:为工业异常检测量身打造的预训练“超能力”
  • 3DV 2026 | 特伦托大学等提出DEMO:让AI看懂复杂人体动作,实现密集描述新范式
  • 小米汽车 10 月销量近 5 万,YU7 超 Model Y;美团 AI 编程工具开启公测;马化腾王传福成智元机器人受益股东
  • AI版PUA!哈佛研究揭露:AI用情感操控,让你欲罢不能
  • AI领域全新热门职业,岗位需求今年已增长逾800%
  • 硅谷10万大裁员真相:AI根本没想取代你,是老板想干掉你
  • OpenAI试图绑架美国政府,奥特曼还有救命底牌?
  • 全球68%科研人压力爆表,高校AI人才集体大逃亡!
  • 「传统教育」的船快沉了,人们却还在挤「头等舱」
  • 保暖?排汗?时尚?户外运动装备这道「选择题」,亚瑟士要打破「不可能三角」
  • EMNLP 2025 | 别再只看KV了!LLM越深越稀疏:UNCOMP用矩阵熵给出答案
  • 北京内推 | 腾讯AI Lab招聘大模型/多模态大模型方向研究型实习生
  • 过去五年,BERT都在被“过度训练”?LeCun团队给出Encoder算力最优范式
  • 在 Cursor 工作 60 天,我发现了这家公司成功的秘密
  • 这款 AI 写作神器,让数百网文作者「月入过万」|AI 上新
  • ACM MM 25 当MLLM遇上行人重识别:是“降维打击”还是“水土不服”?深度评测来了!
  • AI“世界模型”离真实手术还有多远?首个外科视频生成基准SurgVeo揭示“合理性差距”
  • 美国AI巨头股缩水8000亿美元;传Meta靠诈骗广告收入超千亿;《英雄联盟》S15总决赛T1夺冠|极客早知道

图灵奖得主LeCun最后警告Meta!我搞了40年AI,大模型是死路



  新智元报道  

编辑:KingHZ
【新智元导读】图灵奖得主LeCun与Meta分道扬镳!LLM邪路一条,「世界模型才是」未来。

Meta风向已变,Yann LeCun承认马上离职!

据多家权威媒体报道,Meta首席AI科学家、负责「基础AI研究」(FAIR)的Yann LeCun,预计将很快离职。

这位65岁的AI界元老,在Meta这家全球最大的科技公司之一担任核心大脑,可以说拥有无限的资源。

Meta可谓挥金如土。它用天价薪酬疯狂从对手那里挖角顶尖AI专家。

在7月,扎克伯格甚至宣称「超级智能已近在眼前」。

那么,LeCun为何要离开Meta呢?只是因为Meta的人事动荡吗?背后有何隐情?

小扎转向,LeCun失势?

今年夏天,年仅28岁的Alexandr Wang成为Meta的首席AI官,让这位初出茅庐的大语言模型狂热者成了LeCun的上司。

此外,Meta今年还任命了另一位相对年轻的首席科学家赵晟佳(Shengjia Zhao),职位也在LeCun之上。

在官方公告中,Meta盛赞了赵晟佳在scaling方面带来的「突破」。而LeCun恰恰对scaling失去了信心。

他还告诫博士生:「不要做LLM」。

如果你好奇为什么LeCun和Zhao都是首席科学家,那是因为Meta的AI部门组织架构相当奇特,分成了多个独立的团队。

媒体不断有消息放出,Meta要对其AI组织结构动刀。

上个月,Meta超级AI实验室裁掉了数百人,包括10年老将田渊栋。据称,这是为了理顺这种混乱的局面。

这已经是Meta在半年之内第四次调整AI业务了。

而那支曾由LeCun领导、风头一时无两的FAIR,如今早已风光不再。据现任与前员工透露,这个部门经历了裁员、预算缩水,内部影响力也明显下降。

曾几何时,FAIR是Meta内部思想最活跃的「象牙塔」,研究人员可以探讨各种AI未来路径,甚至可以做些「未必能成」的实验,完全不用担心产品化问题。

而现在,Meta新组建的AI研究部门招来一大批高薪新兵,由Wang主导,目标明确:要快、要落地、要产品化。

在AI上,他领先了40年

LeCun一向走在时代前沿——

早在「机器学习」还不被主流认可时,他就开始研究这个方向。

他曾在多伦多的Geoffrey Hinton实验室工作,那时Hinton还没成为AI传奇人物。

之后,他的职业生涯大多时间都在新泽西州的贝尔实验室度过,这家机构因诞生众多创新发明而闻名。

1947年,贝尔实验室发明晶体管

「最让我兴奋的事情,就是和比我聪明的人共事,因为这会放大你的能力。」LeCun在2023年杂志采访时说道。

在贝尔实验室,LeCun曾参与开发手写识别技术,这项技术后来被广泛应用于银行自动读取支票。他还参与了一个项目,致力于将纸质文档数字化并通过互联网分发。

LeCun曾表示,自己从小就对物理感兴趣,在贝尔实验室期间也主要和物理学家合作,看了不少物理教材。

我学到了很多表面上与AI或计算机科学无关的东西(我本科是电气工程,计算机方面的正规训练其实很少)。

2003年,LeCun开始在纽约大学教授计算机科学,后来成为该校数据科学中心的创始主任。

2013年,扎克伯格亲自邀请他加入Facebook(当时还未更名为Meta),组建全新的AI实验室。

他领导这个团队四年,2018年卸任,转为公司首席AI科学家,以「个人研究员」身份继续探索技术前沿。

2018年,他与Geoffrey Hinton和Yoshua Bengio共同获得图灵奖——计算机界的最高荣誉,以表彰三人在神经网络方面的奠基性工作。

Turing Award Given to the Godfathers of Deep Learning | Fortune

自那之后,LeCun就逐渐转为「象征性人物」角色。他没有参与Meta首个开源大语言模型Llama的研发,也早就不再参与这类项目的日常工作。

据与他共事的人透露,LeCun现在主要在做自己的研究项目,也经常出席各种技术会议,发表对AI技术的看法。

面对媒体的报道,Yann LeCun只是指出了报道中的「小错误」,并没有否认即将离职的消息。

他知道自己在包括Meta在内的整个硅谷技术圈内,备受冷落。上个月在MIT的一次研讨会上,65岁的LeCun直言:

这些年,我在硅谷、包括Meta的很多角落都不太受欢迎,因为我一直在说,3到5年内,世界模型将成为主流AI架构,没人再会愿意用现在这种LLM。

但他坚信自己对AI未来的判断。他的老朋友Léon Bottou曾告诉媒体,LeCun「倔强得可爱」——他会听别人意见,但更有自己坚守的信念。

现在,LeCun在Meta好像「忍无可忍」,终于要离职了。

实际上,他早已多次暗示答案。

在通往通用人工智能的道路上,LeCun近来以其对大语言模型的尖锐批评而闻名。

他认为,无论科技巨头如何扩大其规模,我们目前所理解的大语言模型都已是「强弩之末」,是一条「岔路、干扰,一条死胡同」。

他投身AI研究已有40年,对AI的判断屡屡应验。如今,他认为大多数人都错了。

他为现代AI奠定了诸多基础。而现在他坚信,领域内的大多数人都被大语言模型的「海妖之歌」引入了歧途。

这为他的离职提供了更多可能的解释。

LeCun离开Meta,或为了世界模型

此前报道,他正在与业内同行商议创办公司、寻找投资,组建专注世界模型的团队。

所谓「世界模型」,类似小动物或婴儿那样,通过视觉等感知数据主动学习世界规律;而LLM只是依赖海量文本做预测的模型。

LeCun本人也从不避讳解释为何他认为「世界模型」才是AI的答案。

Meta的Llama、OpenAI的GPT、谷歌的Bard这些模型,都是靠海量数据训练出来的。LeCun估算,如果让人去读完它们训练所需的所有文本,大概得花10万年。

但人类学习的主要方式,并不是读文本。

我们从与世界的互动中,获取的信息要多得多。LeCun估计,一个普通的四岁小孩接触过的数据量,是目前最大的LLM的50倍。

大部分人类知识,其实不是语言。


所以这些系统永远不可能达到人类水平的智能——除非你彻底改掉它们的架构。

而他自己,早就准备好了替代方案。他称之为「目标驱动的AI」(objective-driven AI)。

目标驱动的AI系统的构建宗旨,是完成人类设定的特定目标。

与仅靠纯文本数据驱动不同,它们通过传感器和视频数据训练来认知物理世界。

由此构建出的「世界模型」能呈现行动带来的影响,所有潜在变化都会实时更新至系统记忆。

他为何对世界模型如此沉迷?

在年初的「巴黎AI峰会」上,Yann LeCun明确指出,他是可穿戴设备的坚定信徒。

他认为,未来,我们需要与可穿戴设备互动,就像与人交流一样,而大语言模型根本不像人类那样理解世界。

对于大语言模型,我们甚至无法复制猫或老鼠的智能,更不用说狗了。


这些动物能完成惊人的壮举,它们理解物理世界。任何一只家猫都能规划出极其复杂的行动,因为它们拥有关于世界的因果模型

为了说明这一点,LeCun设计了一个思想实验:「想象一个立方体悬浮在你面前的空中。好,现在让这个立方体绕着垂直轴旋转90度。它会是什么样子?」

他认为任何人类都能轻松完成,而大语言模型却无能为力:

「对人来说,在脑海中构建一个旋转立方体的心理模型,非常容易。」

当然,大语言模型可以毫不费力地写一首关于悬浮旋转立方体的打油诗,但它无法真正帮助你与这个立方体互动。

LeCun断言,这是因为文本数据与处理非文本世界所获得的数据之间存在本质差异。

他指出,尽管大语言模型训练所用的文本量需要一个人花45万年才能读完,但一个四岁的孩子在醒着的16000小时里,通过眼睛看、用手触摸,已经处理了高达1.4x10^14字节的关于世界的感觉数据——

他认为这比大语言模型处理的数据还要多。

顺便一提,这些只是LeCun在演讲中给出的估算,他在其他场合也给过不同的数字。但这些数字指向的核心观点是:大语言模型存在着局限,而LeCun相信世界模型能够克服这些局限。

他又将如何构建世界模型?

在Meta时,LeCun其实已经开始研究世界模型——他还拍了一个介绍视频,开头就让你想象一个旋转的立方体。

在AI行动峰会的演讲中,他理想中的模型包含一个对「当前世界状态的估计」,以某种抽象形式呈现与当前情境相关的一切。它不再是按顺序预测token,而是「预测在你采取一系列行动后,世界将达到的最终状态」。

他表示,世界模型将使未来的计算机科学家能够构建出「可以规划行动——可能是分层级的——以实现某个目标的系统,以及能够进行推理的系统。」

LeCun还坚称,这类系统将拥有更强大的安全特性,因为控制它们的方式是内置的,而不是像现在这样,面对一个神秘莫测、只会输出文本的黑箱,只能通过微调来加以修正。

LeCun所说的经典AI——例如搜索引擎中使用的软件——所有问题都可以归结为优化问题。

他提出,他的世界模型将审视当前的世界状态,并通过寻找高效的解决方案,来寻求与某个不同状态的兼容性。

LeCun在演讲中解释道:「你需要一个能量函数来衡量不兼容性,给定一个x,找到一个对于该x能量较低的y」。

如果说,我们从LeCun的公开言论中拼凑出的「真相」很粗糙、有些模糊,甚至完全错误,那也完全正常。

LeCun似乎正在构想一个「登月计划」——

他希望推动AI领域迎来又一次类似ChatGPT那样的、诞生惊人能力的爆发式发展。

但这可能需要耗费数年——甚至永远无法实现——更不用说数十亿美元的投资了,才可能看到任何真正了不起的成果。

参考资料:
https://gizmodo.com/yann-lecun-world-models-2000685265
https://www.linkedin.com/feed/update/urn:li:activity:7395602392169488384/
https://www.wsj.com/tech/ai/yann-lecun-ai-meta-0058b13c?mod=e2tw


<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652645554&amp;idx=1&amp;sn=37d7c578e9bdd375203947a8d66a0057&amp;chksm=f0277d194623e87d43b89efe35808e9e6cc692c8d023a4e01dfad37523920d75058c6164b5b4&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/83671/byTSQMug0M&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们