动态列表

OpenAI「GPT门」事件引爆！Plus、Pro账户统统降配，偷换模型全网实锤
突发，普林斯顿CS博士后猝然离世！清华本科毕业，刚完成论文答辩
国内首次！8.9毫秒推理速度破纪录，1元打穿百万token
惊现高管离职潮！马斯克亲信操盘xAI，千亿美元能填AGI野望？
黄仁勋2小时反驳「AI泡沫帝国」论！英伟达将成全球首家十万亿市值公司
云与AI，如何托举 Z 世代的创新野心
8GB显卡的逆袭！SSD换显存，3060 Ti硬跑100k长上下文
NeurIPS 2025 | 我奶奶都能复现？条件表征学习：矩阵一乘，表征立马“对齐”！
北京/杭州内推 | 阿里通义实验室招聘多模态大模型与智能体方向算法实习生
InterDigital开源CompressAI-Vision：为“AI看”的视频压缩，打造一个“通用跑分平台”
24.98万的理想i6，在特斯拉、小米、蔚来「后院」放了一把火
小米 17 开售 5 分钟，破国产机销售纪录；Meta 研发机器人项目；国内发布「脑机接口标准」
Stability AI前CEO惊人预测：人类智力价值归零，只剩1000天！
刚刚，奥特曼预言：人类「只剩」最后5年！
免训练加速61倍！陈怡然团队新作DPad：仅关注「彩票token」
估值840亿AI实验室再放大招，他们要给大模型戴上「紧箍咒」
苹果掀桌！扔掉AlphaFold核心模块，开启蛋白折叠「生成式AI」时代
自动驾驶进入大模型时代，主机厂寻找「联合创始人」
复旦等揭秘机器人“大脑”安全漏洞：一张图就能让它“宕机”，攻击成功率76.2%
DASFAA 2025 | 湖大等提出SCRA-VQA：给LLM一份“精装修”的图像描述，无需训练提升VQA性能
苹果官方旗舰店也放假，商品不发货；腾讯推「老年打车」服务；车主酒驾，智能驾驶「报警」｜极客早知道
刚刚，ChatGPT Pulse上线！私人秘书不再是富人特权
颠覆算力格局！全球首个星座级太空AI算力服务，在中国诞生
OpenAI 3万亿美元测试，AI首战44个行业人类专家！
JHU教授揭秘学术潜规则：普通博士如何打破鄙视链翻盘？
Hinton预言错了！年薪狂飙52万美元，AI没有「干掉」放射科医生
168 元一年的「小红卡」，是小红书打破本地生活红海的钥匙
当 5 亿玩家涌入 AI 的 3D 新世界
博士申请 | 香港中文大学（深圳）冀晓强老师课题组招收人工智能全奖博士/硕士
128k死穴被击穿！Amazon爆改长上下文：段内压缩快4×，推理不掉点还更准
普林斯顿陈丹琦组新作：RLHF难支撑，RLVR有边界？RLMT开辟第三条路
AI 到底会不会做生意？1688 的答案让人惊喜
找人不求人？Lessie 让「人脉玄学」变成算法游戏｜AI 上新
斯坦福推出VisualMimic：让机器人“眼观六路”，零样本完成复杂任务
浙大发布RS3DBench：让遥感AI看懂3D世界，首个像素级对齐的大规模基准来了！
小米 17 系列发布，4499 起；追觅「库里南」图片曝光；YU7 Max 成「百万最速」车
刚刚，LeCun团队开源首款代码世界模型！能像程序员一样思考的LLM来了
AI正在偷走白领工作！OpenAI狂砸10亿教AI上班，你的完美继任者即将上岗
Sora 2瑟瑟发抖！通义万相2.5放大招：一句话出1080P电影，音画精准同步
信息熵之后，清华提出状态熵！量化分析「系统智能性」的全新视角
突发！Meta刚从OpenAI挖走了清华校友宋飏
KV缓存不再爆！清华姚期智团队重写注意力维度，长上下文更省更强 | NeurIPS 2025 Spotlight
78条打穿1万条！上交大新范式告诉你：智能体训练靠“质”，不是靠“量”
北京内推 | 中科院软件所数据科学研究中心招聘大语言模型算法实习生
三款骁龙芯片曝光，高通谷歌联手打造「安卓 PC」时代
Instagram 月活破 30 亿，靠“短视频”和“私信”；2027款iPhone曝光；女子用ChatGPT选号中百万大奖，全部捐出
一年4次迭代，狂堆GPU成真！微软AI冷液灌芯，散热暴涨3倍
刚刚，阿里CEO吴泳铭发布「ASI宣言」：超级智能才是终局！
前Meta工程师爆料：17人团队15个H-1B！一夜之间80%对手没了？
秘塔AI放大招！「边想边搜边做」，内置20+智能体，想法一键实现
震撼！AI物理「双修」：亥姆霍兹方程嵌进生成器，伪影当场消失
恶劣天气下的图像修复：南理工等提出LCDiff，让AI在雨雪雾天也能看得清
OCRBench v2 25年9月最新榜单发布！揭示多模态大模型文档智能真实水平
博士申请 | 加拿大麦吉尔大学智能自动化实验室招收大模型/强化学习方向全奖博士生
NeurIPS 2025 | 甩掉文本CoT！FSDrive开启时空思维链，自动驾驶迈入视觉推理时代
RL不再撒胡椒面！港科大 × 清华新作：只盯“规划token”，大模型推理力狂飙
3 天卖完今年所有产能，蔚来全新 ES8 如何实现逆风翻盘？
超越 AGI，阿里剑指「超级智能」
Point-SSM：一种用于点云分析的极简状态空间模型，在医学点云任务上表现SOTA
字节跳动OmniInsert炸场：无需掩码，任意物体“贴”进视频，效果碾压闭源SOTA！
ContextFlow：无需训练的视频编辑新范式，实现电影级魔改！
忘了法拉利，一辆中国车正在改写游戏规则
40亿投进去，换回了什么？全新问界M7的「值得」哲学
华为问界新 M7，1 小时大定 3 万；李想：iPhone 17 顶配太丑，不买；防台风，腾讯「捆绑」QQ 企鹅塑像
一半人明天不上班，GDP不会掉一点！耶鲁大学揭AGI残酷真相
告别胶水代码，5倍飚速！无问芯穹首次揭秘，Infra智能体蜂群登场
Depth Anything再出新作！浙大 & 港大出品：零样本，优化任意深度图
H-1B「天价签证」引爆恐慌！印裔精英返乡梦碎，2800亿市场剧震
突发：甲骨文CEO下台！刚和OpenAI签下3000亿美元大单，或因路线斗争
年轻一代创作者，学会与 AI 共舞
KDD 2025 | 从个股偏离到市场共振：UMI挖出股市非理性因子，显著提升预测精度
北京内推 | Apple中国招聘机器学习/AI方向研究型实习生
一套框架搞定图像定制！IC-Custom统一「位置相关/无关」，万物迁移真落地
MiniCPM-V 4.5技术报告正式出炉！首个高刷视频理解多模态模型全解析
TPAMI | 数据增强还在“盲操”？南大提出IPF-RDA，让模型训练告别信息丢失
SilentStriker：无声击溃大模型
Yann LeCun团队新作LLM-JEPA：结合联合嵌入预测架构，显著提升大模型微调性能与效率，在代码生成任务上表现卓越
小米 17 系列手机官宣 9 月 25 日发布；iPhone 17 标准款需求超预期，苹果已增产；罗永浩再回应债务问题：个人债务五年前就还完了，后面是主动还的公司债务｜极客早知道
比思维链准43%！逻辑脑+大模型直觉，推理可靠性大幅提升
陶哲轩官宣AI数学基金首轮名单：29个项目瓜分1.3亿，数学界沸腾！
GPT-5仅23.3%，全球AI集体挂科！地狱级编程考试，夺金神话破灭
一手奶瓶一手键盘！新手宝妈产假氛围编程，自研实用家庭App
刚刚，DeepSeek-V3.1「终极版」重磅发布！最大提升超36%，V4/R2还远吗？
为了千元机用户的「流畅权」，OPPO 为安卓换了个「引擎」
一年卖出 10 个亿，这是年轻人真正的「户外神器」
Teable 宣布完成数百万美元天使轮融资，让数据库「长出耳朵和手」
北京内推 | 智源研究院多模态交互研究中心招聘多模态/具身智能方向研究型实习生
博士申请 | 复旦大学魏龙老师课题组招收AI4Science方向博士/硕士/RA/实习生
Lumos-1登场！自回归 + 离散扩散合体：让大模型真正“构造”动态世界！
RLHF要下岗？Meta × 牛津搞出新套路：用算力教算力，大模型训练新范式来了！
不到两千块，我拍到了专业级别的月全食｜New Things
字节跳动SAIL-VL2登顶OpenCompass，开源高效多模态新标杆
苹果发布Manzano：一种简单可扩展的统一多模态大模型，其混合视觉Tokenizer统一了理解与生成任务，性能SOTA
博后年薪40万到90万 | 东方理工朱文韬课题组招聘AI方向博士后、研究助理教授、访问学生、实习生
黄仁勋出手，50 亿美元入股英特尔，英伟达一统「GPU+x86」生态
巴菲特清仓比亚迪，期间股价上涨 38 倍；苹果折叠屏手机细节曝光；雷军年度演讲定档 9 月 25 日

NeurIPS 2025 | 北大等提出C²Prompt：解耦类内与类间知识，破解联邦持续学习“双重遗忘”难题

2025-09-28未知作者来源

CV君 2025-09-28 12:12 江苏

一招解耦，告别联邦学习“双重遗忘”？

今天想跟大家聊一篇来自北京大学、中国科学院大学和内蒙古工业大学的最新研究成果，这篇论文已经被 NeurIPS 2025 接收。

想象一下，我们有很多智能设备（比如手机），它们各自在本地学习新知识，同时又需要协作共享，共同进步。这个场景就是“联邦学习”。但如果任务是持续不断更新的，比如今天识别猫狗，明天学习识别鸟类，问题就变得复杂了，这就是“联邦持续学习”（Federated Continual Learning, FCL）。

FCL面临一个非常棘手的“双重遗忘”问题：一是“时间遗忘”，即模型在学习新知识时忘记了旧知识；二是“空间遗忘”，即不同设备（客户端）学习到的知识相互冲突，导致全局模型性能下降。

最近，基于“提示”（Prompt）的方法在FCL领域表现不错，它通过固定一个大的预训练模型，只为每个任务学习和交换一些轻量的“提示”来解决问题。但作者发现，现有方法在处理跨客户端的“类别级知识一致性”时存在短板，这会加剧“双重遗忘”。

为了解决这个问题，研究者们提出了一个名为 C²Prompt 的新方法。这个名字也很有意思，C² 代表“Class-aware Client”，即“感知类别的客户端”，Prompt点明了这是一种基于提示的方法，合起来就是“为联邦持续学习设计的、能感知类别并进行客户端知识交互的提示方法”。

文章标题：C²Prompt: Class-aware Client Knowledge Interaction for Federated Continual Learning
论文地址：https://arxiv.org/abs/2509.19674
项目地址：https://github.com/zhoujiahuan1991/NeurIPS2025-C2Prompt

核心思想：两大组件解耦知识冲突

C²Prompt的核心在于，它在客户端之间进行提示（Prompt）交流时，显式地增强了“类别级知识的一致性”。它主要通过两个巧妙设计的组件来实现：

本地类别分布补偿 (Local Class Distribution Compensation, LCDC)这个组件用来解决“类内分布差异”问题。简单来说，不同客户端上关于同一个类别的数据可能看起来不太一样（比如客户端A的“猫”都是橘猫，客户端B的都是黑猫），这会导致学习到的“猫”的语义表示有偏差。LCDC通过在本地收集各个类别的特征分布，上传到服务器进行聚合，估算出一个“全局平均”的类别分布，然后再发回给各个客户端。客户端利用这个全局分布来训练一个“补偿提示”，把本地有偏差的特征“拉回”到全局平均水平，从而增强了类内知识的一致性。
类别感知提示聚合 (Class-aware Prompt Aggregation, CPA)这个组件则专注于解决“类间知识混淆”的问题。在聚合不同客户端上传的提示时，如果简单粗暴地平均一下，很可能会让不同类别的知识相互干扰。CPA则聪明得多，它会评估每个提示与不同类别的相关性，然后有选择性地、加权地聚合那些与特定类别高度相关的知识。这样一来，就能有效减少类别间的混淆，让聚合后的知识更“纯粹”。

实验效果：全面超越SOTA

为了验证C²Prompt的实力，作者在ImageNet-R、DomainNet和CIFAR-100等多个主流FCL基准上进行了大量实验。

从上表可以看到，无论是在ImageNet-R还是DomainNet数据集上，C²Prompt在平均准确率（Avg）等多个关键指标上都显著优于之前的所有方法，达到了 新的SOTA 水平。例如，在ImageNet-R上，它的平均准确率达到了 87.20% ，相比之前最好的方法Powder提升了 2.51% 。

上图展示了在持续学习过程中，模型在已见任务上的平均准确率变化曲线。可以看到，C²Prompt的曲线（红色实线）不仅全程领跑，而且保持了非常平稳的上升趋势，这说明它在新旧知识之间取得了很好的平衡，有效抑制了灾难性遗忘。

为了证明两个核心组件（LCDC和CPA）的有效性，作者还进行了消融实验。结果显示，单独使用任何一个组件都能带来性能提升，而将两者结合使用时，效果最好，证明了它们之间的互补性。

更有趣的是，通过可视化提示的注意力图，可以发现C²Prompt生成的提示能更精准地聚焦于图像中的判别性区域（比如物体的关键部分），而忽略不相关的背景。这直观地证明了该方法学习到的知识质量更高。

在通信开销方面，C²Prompt也控制得相当不错。相比之前的方法，它只带来了非常微小的额外开销，这在资源受限的边缘设备上尤为重要。

作者还在不同的数据异构性（β值）下进行了测试，发现在数据分布差异极大的情况下（β值很小），C²Prompt的优势更加明显，这充分说明了其鲁棒性。

超参数的分析也表明了模型的稳定性和设计的合理性。

最后，更多的可视化结果进一步佐证了C²Prompt在不同数据集上的优越性。

总结

CV君认为，这篇工作非常有启发性。它没有停留在简单地聚合或选择提示，而是深入到了“类别”这个更细的粒度，去分析和解决知识冲突的根源。通过解耦类内和类间的知识交互，C²Prompt为解决联邦持续学习中的“双重遗忘”问题提供了一个非常优雅且有效的方案。这种对知识进行精细化管理的思想，或许能为未来FCL甚至更广泛的分布式学习领域的研究带来新的思路。

大家对这个方法怎么看？欢迎在评论区留下你的看法！

阅读原文

跳转微信打开

动态列表

核心思想：两大组件解耦知识冲突

实验效果：全面超越SOTA

总结

类别

资源

联系我们