动态列表

  • 谷歌DeepMind最新论文,刚刚登上了Nature!揭秘IMO最强数学模型
  • GPT-5.1发布当天,文心5.0杀回来了
  • 一句「你还好吗」值40亿?斯坦福博士出走xAI,押注AGI共情力
  • 营收狂飙的「暗面」:Meta成「全球欺诈大本营」?
  • 小鹏科技日「太魔幻」:机器人走猫步,飞行汽车接近量产
  • Roboflow&CMU论文披露RF-DETR细节:首个COCO数据集突破60 AP实时目标检测,速度飙升20倍!
  • AAAI 2026 Oral 中科大联合西工大提出RSKT-Seg:专为遥感打造的高效开放词汇分割框架,推理提速2倍
  • 深度研究智能体真的“懂你”吗?OPPO × 浙大首发个性化深度研究评测基准
  • 博士申请 | 佛罗里达大学计算机系招收NLP/LLM方向全奖博士/实习生
  • DeepSeek罗福莉正式亮相小米AI;「周杰伦概念股」联手宇树造 IP 机器人;乘用车百公里加速不少于5秒
  • 奥特曼下注27岁神秘青年,「复活」世界最顶级实验室
  • AI秒破18世纪「天书」账本!谷歌新模型盲测刷屏全网
  • Llama 4造假丑闻幕后:小扎豪赌143亿,却为中国AI「做了嫁衣」
  • 少年沉迷AI自杀,9岁遭性暗示!这门「孤独生意」,正推孩子入深渊
  • ConsistEdit:重新定义AI视觉编辑,港科大、清华等机构提出MM-DiT注意力控制新方法
  • NeurIPS 2025 | 中科院携手快手发布LiveStar:首个“会说话、懂沉默”的直播AI,推理速度提升1.53倍
  • 双十一算力真敢卷!RTX 5090低至0.69元/时,同预算跑更多实验
  • AAAI 2026 | 悉尼科技大学 × 港理工推出 FedVLR:让联邦推荐也能“懂图文”
  • 北京内推 | 阿里高德地图团队招聘大模型方向算法实习生(可长期/转正)
  • 对话元理智能张帆:为什么「商业强化学习」,才是 AI To B 的新出路
  • 深度复盘:大疆是如何成为影像领域新巨头的?
  • 传李想亲抓人事,华为系高管退出理想;Meta 首席 AI 科学家杨乐昆离职创业;AI 减肥或致饮食失调
  • Nature子刊:太空中建数据中心,无限能源,浙大首次证实可行!
  • 英伟达铁幕之后,谷歌AI芯片已成气候
  • 翻译界的ChatGPT时刻!Meta发布新模型,几段示例学会冷门新语言
  • 硅谷GPU蒙尘,马斯克一言成谶:美国AI被电卡脖子
  • 65岁图灵巨头离职创业!LeCun愤然与小扎决裂,Meta巨震
  • 年产值突破 150 亿,刚毕业的俊男美女涌入「团播」工厂
  • 马斯克想要 1 万亿,何小鹏只想等一句「牛 P」
  • 通往AGI的歧路:上海AI Lab重磅发现,自进化智能体可能“错误进化
  • 北京内推 | 百度文心一言基座团队模型组招聘大模型方向研究型实习生
  • 全模态到底是不是“1+1>2”?美团UNO-Bench揭示单模态与全模态能力的组合规律
  • NeurIPS 2025 | 上交大、南农大提出ADPretrain:为工业异常检测量身打造的预训练“超能力”
  • 3DV 2026 | 特伦托大学等提出DEMO:让AI看懂复杂人体动作,实现密集描述新范式
  • 小米汽车 10 月销量近 5 万,YU7 超 Model Y;美团 AI 编程工具开启公测;马化腾王传福成智元机器人受益股东
  • AI版PUA!哈佛研究揭露:AI用情感操控,让你欲罢不能
  • AI领域全新热门职业,岗位需求今年已增长逾800%
  • 硅谷10万大裁员真相:AI根本没想取代你,是老板想干掉你
  • OpenAI试图绑架美国政府,奥特曼还有救命底牌?
  • 全球68%科研人压力爆表,高校AI人才集体大逃亡!
  • 「传统教育」的船快沉了,人们却还在挤「头等舱」
  • 保暖?排汗?时尚?户外运动装备这道「选择题」,亚瑟士要打破「不可能三角」
  • EMNLP 2025 | 别再只看KV了!LLM越深越稀疏:UNCOMP用矩阵熵给出答案
  • 过去五年,BERT都在被“过度训练”?LeCun团队给出Encoder算力最优范式
  • 北京内推 | 腾讯AI Lab招聘大模型/多模态大模型方向研究型实习生
  • 在 Cursor 工作 60 天,我发现了这家公司成功的秘密
  • 这款 AI 写作神器,让数百网文作者「月入过万」|AI 上新
  • ACM MM 25 当MLLM遇上行人重识别:是“降维打击”还是“水土不服”?深度评测来了!
  • AI“世界模型”离真实手术还有多远?首个外科视频生成基准SurgVeo揭示“合理性差距”
  • 美国AI巨头股缩水8000亿美元;传Meta靠诈骗广告收入超千亿;《英雄联盟》S15总决赛T1夺冠|极客早知道
  • 谷歌二代Nano Banana爆出!一键推演微积分,终结PS时代
  • 狗也被AI抢饭碗?好莱坞动物演员全下岗,观众直接翻脸了!
  • ChatGPT求婚火了,一句「我愿意」刷屏!网友:是真爱了
  • 小成本DeepSeek和Kimi,正攻破奥特曼的「算力护城河」
  • NeurIPS25 | 清华&北大提出LinearDiff-ViT:让Transformer学会“找不同”,实打实提升模型性能
  • AI 六巨头罕见同台,辨论 AI 泡沫;SpaceX 公布简化版登月舱方案;王者荣耀年度总决赛首次在鸟巢举办
  • LLM首次达到人类语言专家水平!OpenAI o1拿下拆解句法、识别歧义、推理音律
  • 仅2天!谷歌AI破解十年谜题,锁定救命药人类全失手
  • 终结Transformer统治!清华姚班校友出手,剑指AI「灾难性遗忘」
  • 仅0.2B就比GPT-4.1强?加州大学新指标:组合推理基准首次超越人类
  • AI六巨头罕见同台!李飞飞激辩LeCun,黄仁勋:你们都错了
  • 复盘大疆 Pocket 的七年:从「定义产品」到「定义时代」
  • TRO'25开源|机器人建图的终局?一个框架搞定光学、几何与语义!
  • 10.58 万!零跑造了一台「红米 YU7」
  • 当一家传统车企,终于决定「师中长技」
  • AI热潮推动,全球 DRAM 内存价格暴涨;泡泡玛特回应直播事故;媒体爆料iPhone 18 Pro工程机进展
  • 强化学习教父重出江湖, 生成式AI的时代要结束了?
  • 英伟达新架构引爆全模态大模型革命,9B模型开源下载即破万
  • 投85份简历0 Offer!CS研究生心态崩了,亲历20年最猛裁员潮
  • 视频模型假装在推理?MME-CoF新基准评估12个推理维度
  • Ilya、小扎之后,苏莱曼的「超级智能」进入7年倒计时!
  • IROS 2025 | 北理工提出BoRe-Depth:仅8.7M参数,在嵌入式设备实现50.7 FPS高清深度估计
  • TCSVT 25 | 宁波诺丁汉大学等提出De-LightSAM:仅需SAM-H 2%参数,实现通用化医疗影像自动分割
  • 有些答案,听 AI 说一百遍,不如和「最有料的人」聊一次
  • 上交大刘鹏飞团队:Context Engineering进入2.0,上下文成为可操作对象
  • 工程&计算机领域前沿洞察 | Synthesis技术前沿报告合集
  • 用 AI 做电商真实效果如何?我们调研了双 11 一线从业者
  • 马斯克 1 万亿美元的薪酬方案获特斯拉股东批准;东方甄选孙东旭离职;Altman:今年 OpenAI 年化收入将达 200 亿美元

ICLR 2026出分,审稿员怒喷「精神病」!DeepMind研究员教你绝地求生



  新智元报道  

编辑:KingHZ
【新智元导读】ICLR 2026评审结果震撼出炉:投稿量暴增至近2万篇,却迎来分数大滑坡,平均分从5.12跌至4.2。审稿人吐槽论文质量低下,甚至疑似AI生成,这场学术盛宴为何变味?

ICLR 2026评审结果公布了!

这届ICLR论文投稿数量创历史新高。

根据Paper Copilot网站统计,与2025年的11672篇总投稿论文相比,ICLR 2026共有19631篇投稿,数量增加了,但质量却下降了——

ICLR 2025最高分为满分10分,ICLR 2026最高为8.5;

ICLR 2025平均分为5.12分,ICLR 2026平均为4.20。

链接:https://papercopilot.com/statistics/iclr-statistics/iclr-2026-statistics/

已有多名投稿人经历人生中第一次在ICLR上获得0分:

左右滑动查看

国内有投稿人甚至3篇投稿「全军覆没」,发推感叹独特的人生经历:

左右滑动查看

ICLR 2026将于明年4月23日至27日,在巴西里约热内卢举行。

与NeurIPS和ICML一样,ICLR是机器学习和人工智能研究领域中三大高影响力的会议之一。

ICLR,全称「International Conference on Learning Representations 」(国际表征学习大会),在2012年由图灵奖得主Yann LeCun和Yoshua Bengio创立。

ICLR 2026平均得分低了近1分

总体上,ICLR的分数平均值比去年下降了近一个点:

2026年:前30%的提交分数超过约5.0分

2025年:前30%的提交分数超过6.0分


上下滑动查看

生物医学工程博士Afshin Khadangi使用API获取了19129条评审意见,总结了其中的一些亮点:

仅有1792篇(约9%)论文的平均评分达到6分及以上。


1篇论文(id 12681)获得了9条评论!


在个人评分中,平均值为4.22,标准差为1.86,来自74,371条评论。

上下滑动查看

审稿人Cheems Wang注意到所在领域没变论文至少有一个极端分数,今年的评分确实保守了。

审稿人Yu Su也注意到平均分有些低,225篇论文中只有18篇论文平均初始得分超过了6分,勉强达到会议接受底线。

清华大学博士、普林斯顿博士后发现了ICLR 2026明显的评分模式:

提交ID越高,评分似乎越低。

有人两年前就发现类似模式了:

让人大吃一惊的是,评审现场惊现「精神病」评论:

如此激烈的审稿现场,引起Reddit网友围观:

现在原始的审稿意见已删除,审稿人为自己的冒犯性言论道歉,但坚持称提出的论文问题没有任何错误。

另一位来自亚马逊的一位ICLR审稿人也有牢骚:

在审稿意见刚公布后,我所负责的一篇论文就被撤稿了。

而且今年在多个顶级会议上,他已经遇到好几次类似情况。

他表示,这类论文往往写得很差,充斥着未经定义的新术语、缺失引用,甚至有些段落看起来像是AI生成的。

审稿人常常要花五六个小时去搞懂作者的方法和实验(而这些实验通常也不怎么样),结果最后论文一撤了之,换个会议重新投。

如果作者不做改进,新的审稿人也还得再受一遍罪。

他提议:「是否该设立某种机制,对那些频繁撤稿或无故跳过rebuttal阶段的作者,给予临时投稿禁令?

不过,他之后另发推文表示,某些论文和评审的质量之低,让人沮丧。

他认为,这种沮丧很大程度上源于大家对论文和评审质量分布的期望:

论文质量并不遵循正态分布,而我们却常常试图给出遵循正态分布的评分。下限远比上限离平均值更远。评审质量也是如此。 


但我们期望正态分布,也就意味着我们期望低质量的论文或评审很少,但这并非现实。

这种对正态分布的错误假设在生活中许多领域都存在,正如塔勒布的《黑天鹅》中揭示的。

Meta的研究人员Tarun Kalluri则表示,作为审稿人,列表上一半的论文他花的时间比作者还多。

也有审稿人表示,一旦发现「屡投屡拒」的低分论文,他会马上确认观点,提交简短的评论,避免浪费时间。

不少投稿人对AI顶会的同行评议,意见也很大。

NeurIPS 2025审稿,「谁是Adam?」神评论直接沦为年度最大笑话。

而类似一幕在ICLR 2026也上演了——

图宾根大学博士生Alexander  Panfilov直接说续集已面世。

原因竟是论文中提到「白箱 VS 黑箱」,被认为这些词汇「带有种族歧视的隐含意义」,要求小改。

DeepMind研究员
评审是「随机数生成器」

DeepMind研究员Neel Nanda祝贺了所有投稿人,并提供了一份论文反驳(rebuttal)指南。

上下滑动查看

链接:https://www.lesswrong.com/posts/vJNQZqgnKSxTBdFbS/neel-nanda-s-shortform?commentId=qqHPrBheFwQgrJbzN

他给出的建议就是要大家记住一件事——

同行评审已经被正式验证是一种「随机数生成器」。

在一项随机对照实验中,哪怕是被评为「重点报告」的论文,换一个审稿组也有一半被拒。

所以,别把自我价值寄托在这轮学术轮盘赌是落在红格还是黑格上。

如果评审的批评听起来不太靠谱——那很可能确实如此(也不排除是某个大语言模型写出来的)。

但如果评审意见有道理(当然你得克服自己的防御心态来看),那就太好了——你得到了能让论文变得更好的宝贵反馈!

这份反驳指南本来是为了顶会NeurIPS而写,但就ICLR来说,Neel Nanda认为以上情况依然普遍存在。

但不同之处在于,ICLR更鼓励作者在rebuttal阶段补充重要实验,并上传修订稿。我确实看到ICLR的打分变化幅度通常比其他会议大,但这也意味着需要付出更多额外工作。

另外请注意,ICLR的所有论文和评审意见都是永久公开的,还会被Google检索收录——

所以即便你觉得这篇论文没希望了,也还有动机写清楚为什么评审意见不合理。

他推荐的rebuttal流程如下:

1. 把所有评审意见复制到一个Google文档里; 

2. 给每一条意见做批注,把它们归类为:

3. 误解、观点不一致、表述问题、技术问题; 

4. 和合作者一起讨论如何逐条回应——优先处理重要的; 

5. 然后,写出要点提纲,尽早请人反馈; 

6. 最后润色整理好,提交。

    通常你需要针对每位评审写一段回应,并总结多位评审提出的问题。

    牢记「反驳」阶段的三个核心目标:

    1. 改进论文。其实,评审经常提出一些有用的建议,既然是做科研,最终还是为了把研究做好、把成果清楚传达出去。

    2. 说服评审打高分。争取让他们对你产生好感,自然更愿意调高分数。

    3. 对付不讲理的评审。如果某位评审明显针对你,那核心对象就变成了领域主席和其他评审——你要用有理有据的回应,让他们意识到这位评审的意见站不住脚。换句话说:哪怕是针对性很强的批评,也要认真回应,只是说服的对象换了。

    最重要的一点:让人相信你真的改进了论文

    而且,时间是有限的,你希望最大化单位时间内的回报,而新的实验通常比撰写或概念反驳要花费更长的时间——谨慎地进行优先级排序

    参考资料:
    https://x.com/ShuaichenChang/status/1988626893273468976
    https://x.com/ShuaichenChang/status/1988719279580274768


    <br>
    
    
        <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652644964&amp;idx=2&amp;sn=85d9c6092f9c2eb5e68bb858d616f259&amp;chksm=f024b54c639457185cb2c1137d421f5899809d2bbc7b4151bc9c355645ed98643f618ec0b5a1&amp;scene=0#rd"  target="_blank">文章原文</a>
        <br>
    
    
    
    
    <img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/83671/vbkJ6VEFwG&amp;maxage=1y"  width="1px"></div></div></body></html>
    

    联系我们