动态列表

  • 微软破4万亿,被裁员工扎心!70级工程师天价薪酬曝光:入职大礼包2700万
  • 港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法
  • 刚刚,OpenAI神秘开源模型泄露!「闪现」1分钟被删,配置被网友扒光
  • 24岁辍学博士,小扎捧2.5亿薪酬包亲自上门抢人!AI顶薪已让NBA汗颜
  • 奕派科技重磅发布“未来之翼”战略,2026款东风奕派eπ008限时先享价17.36万元
  • 一切竞争,都变成了「AI 竞争」
  • 途深智合推出旗下AI科研品牌--追梦AI
  • 模型共享、数据互通、设施互连,上海人工智能实验室上线「书生」科学发现平台
  • 一次中稿10篇ACL25,通义实验室 代码智能&对话智能团队 在研究什么
  • 联合三大蛋白质模型,仅需4~6周,定制癌细胞特效「识别器」
  • 全球首款通用AI科研智能体问世:我一个文科生用它写了份CRISPR基因编辑综述报告
  • 中国在AI领域超越美国已是板上钉钉?吴恩达:美国无法保持领先
  • 驯服复杂表格:九天重磅开源,开启「人与表格对话」智能新时代
  • 思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型
  • 超聚变亮相WAIC 2025 重构数智化平台,共建智能体时代
  • Manus大升级,100多个智能体并发给你做任务
  • 挖人上瘾的Meta又被员工吐嘈:不帮忙宣传项目,开源只会越来越糟
  • 机器人不只会抓和放!北京大学X银河通用「世界-动作模型」赋能全面泛化的非抓握技能
  • 火山引擎作为「AI 原生」基础设施,变得更强了
  • 英伟达回应「芯片后门」:不存在后门;大疆推 Osmo 360 全景相机,2999元;微软成第二家 4 万亿美元公司
  • WAIC唯一指定C位,AI「国家队」又赢麻了!秒懂Hinton伦敦腔,现场杀疯老外狂点赞
  • 首部法律LLM全景综述发布!双重视角分类法、技术进展与伦理治理
  • 小扎一夜反水,背刺开源!亲手葬送「Llama神话」,股价大涨12%
  • GPT-5发布倒计时?全网泄露来了:微软Copilot憋大招,GPT-5上线最后冲刺!
  • 17.98 万的乐道 L90,有多少蔚来的诚意,就有多少李斌的「求生欲」
  • ACL'25最佳论文独家解读:大模型有「抗改造」基因,现有后训练范式失灵预警
  • 当提示词优化器学会进化,竟能胜过强化学习
  • ACL 2025主会论文 | TRIDENT:基于三维多样化红队数据合成的LLM安全增强方法
  • 谷歌发布AlphaEarth基础模型:构建「地球版ChatGPT」,融合多源数据,实现10米级地球观测
  • 微软花重金做的Copilot,居然被WPS一个按钮给秒了?
  • 定义科学智能2.0:在WAIC,复旦与上智院的答案是开放协作、科学家为中心,以及一个「合作伙伴」
  • OpenAI提出的CLIP,被Meta联合谢赛宁、刘壮,扩展到全球300+语言
  • VLA-OS:NUS邵林团队探究机器人VLA做任务推理的秘密
  • XREAL One Pro 体验:AR 老炮的自我革命
  • WAIC UP! 之夜:一场关于AI与人类未来的星空思辨
  • AI 智能体,让每个人可以像科学家一样工作和思考
  • 刚刚,扎克伯格公开信:Meta不会开源全部模型
  • 没敲过代码的我,半小时「聊」出一个能用能分享的「小程序」
  • 把指纹焊死在频率上:抗微调神经网络指纹的硬核方案来了
  • 32.18万起!理想i8正面「硬刚」特斯拉Model X
  • 智能驾驶最大的障碍,不是懂车帝
  • 刚刚,DeepSeek梁文锋NSA论文、北大杨耀东团队摘得ACL 2025最佳论文
  • 小米青年公寓正式启用,1999 元/月;Meta AI 数据中心投入 720 亿美元;NBA 引入「AI 篮球」
  • AI百人榜刷屏,小扎照单全收?辛顿Ilya师徒霸榜,第二名竟是本科生
  • 炮轰黄仁勋,决裂奥特曼!1700亿美元估值背后,硅谷最不好惹的AI狂人
  • 别只盯着李飞飞!AI的「3D数据底座」已被这家中国公司悄悄建好
  • 无需准确传感信号!轻松搞定「多段软体机械臂」复杂位姿与形状控制
  • Nature 子刊 | DeepSeek落户超750家医院,清华团队剖析AI医疗监管隐忧
  • P图手残党有救了,豆包·图像编辑模型3.0上线,一个对话框搞定「增删改替」
  • 开出10亿美元天价,小扎挖人Mira创业公司惨遭拒:俺们不差钱
  • 当智能成为主要生产资料,硅基经济学引爆「AI+金融」
  • SPIRAL:零和游戏自对弈成为语言模型推理训练的「免费午餐」
  • 刚刚,OpenAI推出学习模式,AI教师真来了,系统提示词已泄露
  • 凌晨,Qwen又更新了,3090就能跑,3B激活媲美GPT-4o
  • AI安全上,开源仍胜闭源,Meta、UCB防御LLM提示词注入攻击
  • 字节辟谣「豆包汽车」:无造车计划;英伟达市值突破4.3 万亿美元;传特斯拉将推「低价赛博皮卡」
  • 科学能力太强,这个多模态推理「六边形战士」被严重低估!Intern-S1开源登顶
  • 全球首次,「AI记忆」开源落地!MIRIX同步上线APP
  • GPT-5基准测试泄露,被曝两天后发布?打Minecraft震撼开挂网友直呼封神
  • 马斯克偷偷憋了个大招!Grok秒出《阿凡达》画质,好莱坞瑟瑟发抖?
  • 理想i8正式发布:首款纯电SUV,售价32.18万元起
  • WAIC 2025大黑马,一个「谢耳朵AI」如何用分子式超越Grok-4
  • 通义实验室大火的 WebAgent 续作:全开源模型方案超过GPT4.1 , 收获开源SOTA
  • 这家国内公司,在给具身智能技术栈做「通解」
  • ACL首届博士论文奖公布,华人学者李曼玲获荣誉提名
  • 全球首个全链式空间天气AI预报模型“风宇”!国家卫星气象中心牵头,联合南昌大学、华为共同研发
  • LeCun出手,造出视频世界模型,挑战英伟达COSMOS
  • 联合十余家国产生态,商汤大装置发布“算力Mall”,打造算力超级市场
  • 用说的就能做 App,这家公司想做 AI 时代的 ins
  • 从数字人到「有温度的」机器人,京东把 AI 深度应用的路线图「摸透」了
  • 开启RL Scaling新纪元,siiRL开源:完全分布式强化学习框架,支持超千卡规模高效训练
  • 共青年之智,铸AGI未来|2025 WAIC云帆奖得主名单揭晓
  • 阿里再开源,全球首个MoE视频生成模型登场,电影级美学效果一触即达
  • 不靠海量数据,如何精准喂养大模型?上交Data Whisperer:免训练数据选择法,10%数据逼近全量效果
  • WAIC2025,斑马智行元神AI获国际测评机构全项第一
  • 蛋白质基座的GPT时代来了?AMix用Test-time Scaling让蛋白质设计迈向通用智能
  • Allegro-FM:剑指分子动力学基础模型,零样本预测89种元素及复杂反应
  • AI 上新|不会用 PS 的我,却敢去小红书上接「设计单」了
  • GMI Cloud 于 WAIC 2025 展现全栈 AI 基建实力,破解出海成本与效率难题
  • WAIC 2025: 斑马智行元神AI大模型,获全球机构测评第一
  • 国内首例!由钉钉AI平台训练的豆蔻大模型通过妇产科主任医师考试
  • 闭幕式 | 2025世界人工智能大会暨人工智能全球治理高级别会议成功举办
  • 智谱发布新一代基座模型GLM-4.5:开源、高效、低价,专为智能体而生
  • AI Agents的“超级大脑”来了 阿里云正式发布无影Agentbay
  • WAIC 2025前探:AI硬件如何改变我们的日常生活
  • 这届WAIC,无问芯穹发布了三个「盒子」
  • 「幻觉」竟是Karpathy十年前命名的?这个AI圈起名大师带火了多少概念?
  • EvaLearn:AI下半场的全新评测范式!
  • 蚂蚁数科发布金融推理大模型 助力金融机构加速落地智能体应用
  • 2025 WAIC容联云AI AGENT论坛启幕,以技术引擎驱动产业智能跃迁
  • 商汤大装置亮相WAIC 2025,多项标志性成果打造AI基础设施新范式
  • 广大、清华等开发EdgeAIGC,让边缘缓存命中率飙升41%,AIGC延迟与成本双降
  • WAIC直击|快手可灵AI引领「生成式AI应用元年」,累计生成超2亿视频
  • 硬核「吵」了30分钟:这场大模型圆桌,把AI行业的分歧说透了
  • ICCV 2025|UV-CoT:无监督视觉推理新突破,偏好优化重塑图像级思维链
  • 扣子开源全家桶,Apache 2.0加持,AI Agent又一次卷到起飞
  • 多模态大模型,真的「懂」世界吗?——揭秘 MLLM 的核心知识缺陷
  • 具身智能,腾讯「低调入局」
  • 首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练
  • 特斯拉廉价 Model Y 减配内饰曝光;Firefox 终止中国账户运营;宇树王兴兴:经常偷懒,用 AI 写代码|极客早知道
  • CEO卷走24亿,二号员工血亏99%!30亿Windsurf梦碎内幕曝光
  • 90后养老就靠它?清华系机器人WAIC炫技,叠衣取货秀翻全场
  • 谁是Adam?NeurIPS 2025审稿爆年度最大笑话!Hinton也曾被拒稿
  • Nature子刊 | 上交突破极限,端到端无人机高速避障,可微分物理实现
  • 菲尔兹奖得主深度参与,WAIC全方位探讨「AI for Math」
  • AI遇上华夏上古,复旦、上智院、上海创智学院联合发布早期中华文明多模态大模型
  • AI Agent 第一波浪潮过后,OPPO 是怎么闷声做出第一个爆款的?
  • Vibe Coding 开赛,阿里靠新模型赢麻了?
  • 钛动科技发布首个全球营销 AI Agent,改写中国品牌出海「新叙事」
  • 你的AI管家可能正在「拆家」?最新研究揭秘家⽤具⾝智能体的安全漏洞
  • 把《坤舆万国全图》装进口袋,扫描全能王黑科技亮相2025WAIC
  • ACL 2025|驱动LLM强大的过程级奖励模型(PRMs)正遭遇「信任危机」?
  • 世界人工智能大会:分子之心发布10大解决方案 AI蛋白设计迈入“可编程”时代
  • 离线智能,什么时候迎来 DeepSeek 时刻?
  • 阿里模型三连发闪耀WAIC,中国开源模型“周级迭代”引领AI新变革
  • Anthropic 最新估值超 1500 亿美元;首款国产消费级 6nm GPU 亮相;100% 预防艾滋神药获准上市
  • 国产AI首次「长出」原生记忆,非Transformer架构成新王!机器狗当场引爆WAIC
  • Meta百亿抢人内幕!清华学霸转行AGI拿千万年薪,教授校友看呆了
  • 77岁Hinton首度访华,周伯文高能交锋!17分钟尖峰对话震撼全场
  • 刷新无监督异常检测上限!首提「匹配代价滤波for异常检测」范式 | ICML'25
  • WAIC机器人探展:我被全场最靓的崽「Moz1」种草了
  • 数学之问 | 当 AI 与数学在上海相遇:WAIC 2025 背后的智慧革命
  • 尖峰对话17分钟全记录:Hinton与周伯文的思想碰撞
  • 直击WAIC:萝卜快跑入选「国家队」,AI数字人技术升级,百度全栈自研杀疯了
  • ICML 2025 | CoTo:让LoRA训练「渐入佳境」,模型融合、剪枝样样精通
  • 星河启智:科学智能2.0时代,开启「科学家即C位」的自主科学新范式
  • 夸克AI眼镜首次亮相,阿里构建后手机时代随身AI助手
  • 千寻位置与国地中心携手发布首款“时空算力背包”,助力机器人从室内走向室外
  • 在WAIC现场,全球首个拥有「原生记忆力」的大模型亮相,但不是Transformer
  • 手机AGI助手还有多远?移动智能体复合长程任务测试基准与调度系统发布
  • 实测爆火的阶跃星辰Step 3,性能SOTA,开源多模态推理之王
  • 图灵奖得主Hinton国内首次现身演讲:AI超越人类后,我们该怎么做
  • GPT4核心成员、清华校友赵晟佳任Meta超级智能实验室首席科学家
  • 磐石·科学基础大模型:人工智能赋能范式重塑,科学研究开启无限可能
  • WAIC2025 开幕,规模创历届之最;宇树发布第三款人形机器人;上海警方通报饿了么原 CEO 受贿案|极客早知道

ICML 2025杰出论文出炉:8篇获奖,南大研究者榜上有名

包括 6 篇杰出论文奖和 2 篇杰出立场论文奖。

本周一,ICML 2025 公布了最佳论文奖项。

今年获奖论文共计 8 篇,其中包括 6 篇杰出论文奖和 2 篇杰出立场论文奖。值得关注的是,南京大学研究者也位列获奖名单之中。

国际机器学习会议 ICML(International Conference on Machine Learning),是全球范围内人工智能领域的顶级学术会议之一,由国际机器学习学会(IMLS)举办,与 NeurIPS、ICLR 并列为 AI 三大顶会。本届 ICML 为第四十二届,于 7 月 13-19 日在加拿大温哥华举行。

image.png

今年的 ICML 大会共获得 12107 篇有效论文投稿,其中 3260 篇被接收,接收比例为 26.9%。相比 2024 年的 9653 篇投稿数量持续大幅增长,展示了 AI 领域的火热。

以下是今年的获奖论文与简要介绍。

杰出论文奖

论文 1: Train for the Worst, Plan for the Best: Understanding Token Ordering in Masked Diffusions

image.png

  • 论文地址:https://arxiv.org/pdf/2502.06768

  • 作者:Jaeyeon Kim、Kulin Shah、Vasilis Kontonis、Sham Kakade、Sitan Chen

  • 机构:哈佛大学、得克萨斯大学奥斯汀分校

论文摘要: 近年来,掩码扩散模型(MDMs,masked diffusion models)逐渐崭露头角。与自回归模型(ARMs)相比,MDMs 在训练时通过牺牲复杂性来换取推理时的灵活性。具体而言,在训练阶段,MDM 学习解决大量的填充问题,但在推理时,它们几乎以任意的顺序解码 Token。

本文深入研究了这两种竞争效应。

在训练层面,本文通过理论分析和实验验证表明:相较于自回归模型,MDMs 确实需要处理计算复杂度更高的子问题。在推断层面,本文发现采用自适应 Token 解码顺序的策略能显著提升 MDMs 的性能,使其有效规避困难子问题。

在像数独这样的逻辑谜题中,自适应推理可以将预训练 MDMs 的解题准确率从不到 7% 提高到约 90%,甚至超越了具有 7 倍参数量的自回归模型,这些模型通过教师强制(teacher forcing)显式训练,学习正确的解码顺序。 

论文 2:The Value of Prediction in Identifying the Worst-Off

image.png

  • 论文地址:https://arxiv.org/pdf/2501.19334

  • 作者:Unai Fischer Abaigar、Christoph Kern、Juan Perdomo

  • 机构:慕尼黑大学、哈佛大学

论文摘要:机器学习正越来越多地用于政府项目中,以识别和支持最弱势群体,优先为他们提供援助。

本文研究了在追求公平的背景下,预测技术对福利分配的影响,并将其与其他政策工具(如扩大行政资源)进行比较。

通过数学模型和针对德国居民长期失业问题的真实案例研究,本文系统性地评估了预测技术在识别最弱势群体方面的有效性。研究成果为政策制定者提供了明确的分析框架和实用的数据驱动工具,帮助他们在设计此类系统时做出有原则性的决策。

论文 3:CollabLLM: From Passive Responders to Active Collaborators

image.png

  • 论文地址:https://arxiv.org/pdf/2502.00640

  • 论文主页:https://wuyxin.github.io/collabllm/

  • 作者:Shirley Wu、Michel Galley、Baolin Peng、Hao Cheng、Gavin Li、Yao Dou、Weixin Cai、James Zou、Jure Leskovec、Jianfeng Gao

  • 机构:斯坦福大学、微软、佐治亚理工学院

论文摘要:大语言模型通常使用下一轮奖励进行训练,这限制了它们在长期互动中的优化能力。因此,它们常常对模糊或开放性用户请求作出被动回应,未能帮助用户实现最终意图,导致对话效率低下。

为了解决这些局限性,作者提出了 CollabLLM,这是一种新颖且通用的训练框架,旨在增强多轮人类与大语言模型的协作。

其关键创新在于通过多轮感知奖励的协作模拟,估算响应的长期贡献。通过强化学习对这些奖励进行微调,CollabLLM 不仅仅回应用户请求,还能主动挖掘用户意图,并提供富有洞察力的建议,这是迈向更加以人为本的人工智能的关键一步。

他们还设计了一个多轮互动基准,涵盖了如文档创作等三项具有挑战性的任务。与基线模型相比,CollabLLM 在任务表现上提高了 18.5%,并且在语言模型评审者的互动性上提高了 46.3%。

最后,他们进行了一项大型用户研究,涉及 201 位评审者,其中 CollabLLM 提高了 17.6% 的用户满意度,并减少了 10.4% 的用户花费时间。

论文 4:Roll the dice & look before you leap: Going beyond the creative limits of next-token prediction

image.png

  • 论文地址:https://arxiv.org/pdf/2504.15266

  • 作者:Vaishnavh Nagarajan, Chen Henry Wu, Charles Ding, Aditi Raghunathan

  • 机构:Google Research、卡内基梅隆大学

论文摘要:作者设计了一套最小化的算法任务,作为开放式现实任务的一个宽泛抽象。这使他们能够干净且可控地量化当今语言模型的创造性极限。

与需要创造性、远见性思维飞跃的现实任务类似,他们的任务需要一个隐式的、开放式的随机规划步骤,该步骤要么(a)发现抽象知识图中的新联系(如文字游戏、类比或研究),要么(b)构建新模式(如设计数学问题或新蛋白质)。

在这些任务中,作者在经验和概念上论证了为什么下一个 Token 学习是目光短浅的;多 Token 方法,即无教师训练和扩散模型,相比之下在生成多样且原创的输出方面表现更为出色。

其次,为了在不损害一致性的前提下引发随机性,他们发现将噪声注入输入层(称为种子条件化)在很多条件下的效果与(并且在某些条件下优于)从输出层进行温度采样的效果一样好。

因此,他们的工作为分析开放式创造性技能提供了一个有原则的、最小化的测试平台,并提出了超越下一 Token 学习和温度采样的新论据。

论文 5:Conformal Prediction as Bayesian Quadrature

image.png

  • 论文地址:https://arxiv.org/abs/2502.13228

  • 作者:Jake C. Snell、Thomas L. Griffiths

  • 机构:普林斯顿大学

论文摘要: 基于机器学习的预测系统在高风险场景中的应用日益广泛,了解此类预测模型部署后的表现至关重要。诸如共形预测之类的分布无关不确定性量化技术,即使在模型细节隐藏的情况下,也能保证黑盒模型的损失。然而,此类方法基于频率概率,这过度限制了它们的适用性。本文从贝叶斯视角重新审视共形预测的核心内容,从而阐明频率概率保证的不足之处。

本文提出了一种基于贝叶斯求积的实用替代方案,它能够提供可解释的保证,并更全面地表示测试时可能观察到的损失范围。

论文 6:Score Matching with Missing Data

image.png

  • 论文地址:https://arxiv.org/abs/2506.00557

  • 作者:Josh Givens、Song Liu、Henry W J Reeve

  • 机构:布里斯托大学、南京大学

论文摘要:分数匹配是学习数据分布的重要工具,其应用领域涵盖扩散过程、基于能量的建模和图模型估计等诸多领域。尽管应用广泛,但很少有研究探讨其在数据不完整情况下的运用。

该研究通过调整分数匹配(及其主要扩展)来解决这个问题,使其能够在灵活的设置下处理缺失数据,其中数据可能在任何坐标子集上出现部分缺失。本文提供了两种独立的分数匹配变体供一般使用:重要性加权 (IW) 方法和变分方法。本文在有限域设置下为 IW 方法提供了有限样本边界,并证明其在小样本低维情况下尤其表现出色。

此外,本文还证明了变分方法在更复杂的高维设置下表现最佳,这一点在真实数据和模拟数据的图模型估计任务中均得到了验证。

杰出立场论文奖(Outstanding Position Paper)

ICML 大会在 2024 年首次设置了 Position Paper 赛道,与传统 research paper 不同,它更注重观点性、前瞻性和讨论性,而非纯粹的技术创新。该赛道鼓励作者提出对机器学习领域关键问题的深刻见解、争议性观点或未来发展方向的分析,旨在激发学术界的广泛讨论和反思。

今年有 2 篇论文入选。

论文 1:The AI Conference Peer Review Crisis Demands Author Feedback and Reviewer Rewards

image.png

  • 论文地址:https://arxiv.org/abs/2505.04966

  • 作者:Jaeho Kim、Yunseok Lee、Seulki Lee 

  • 机构:韩国蔚山科学技术院(UNIST)

论文摘要:随着人工智能领域主要会议投稿数量的激增(每个会议投稿超过 10,000 篇),同行评审流程面临前所未有的挑战,评审质量和评审责任问题也日益引发关注。

本文主张将传统的单向评审系统转变为双向反馈机制,在这种机制中,作者对评审质量进行评估,审稿人获得正式的认证,创建一个责任框架,促进一个可持续的、高质量的同行评审系统。

当前的评审系统可以视为作者、审稿人和系统(即会议)三方之间的互动,这三方对当前的问题共同负责。但是,作者的问题只能通过政策执行和检测工具来解决,而伦理问题只能通过自我反思来纠正。

因此,本文重点探讨通过两种关键机制改革审稿人问责制,并引入系统性奖励:

(1)双阶段双向评审系统,允许作者评估评审,同时最大程度地减少报复行为;(2)系统性审稿人奖励系统,激励高质量审稿。

论文 2:AI Safety should prioritize the Future of Work

image.png

  • 论文地址:https://arxiv.org/abs/2504.13959

  • 作者:Sanchaita Hazra、Bodhisattwa Prasad Majumder、Tuhin Chakrabarty

  • 机构:犹他大学、艾伦人工智能研究所等

论文摘要:当前人工智能安全领域的工作重点在于过滤有害内容、防止操纵人类行为以及消除在网络安全或生物安全领域中的存在性风险。尽管这些问题迫切需要解决,但这种狭隘的关注忽视了塑造社会长期发展轨迹的关键以人为本的考量。

在本文中,作者指出了忽视人工智能对未来工作影响的风险,并建议提供全面的过渡支持,以促进具有人类能动性的有意义的劳动的演变。通过经济理论的视角,作者强调人工智能对人类生计的跨时间影响以及劳动市场结构变化,这些变化加剧了收入不平等。

此外,人工智能开发中的主要利益相关方的封闭源代码方法,类似于通过资源剥削的寻租行为,培育了创造性劳动中的平庸,并垄断了创新。为了解决这一问题,他们主张建立健全的国际版权体系,并实施集体许可制度,以确保使用数据训练人工智能模型的公平补偿机制,强烈建议建立一个以人为中心的全球人工智能治理框架,以促进共享繁荣和经济公正,同时减少技术债务。

参考链接:https://icml.cc/virtual/2025/awards_detail

]]>

联系我们