动态列表

  • 比互联网泡沫惨17倍!AI裁员潮上万科学家下一站在哪里?
  • 300只狗试用延寿药,「寿命曼哈顿计划」启动!
  • 谷歌Gemini 3杀疯了!陶哲轩亲测:10分钟干翻百年数学难题
  • NeurIPS重磅:华南理工团队重构扩散模型推理,质量效率双SOTA
  • MIT经济学博士生,用AI骗过了诺奖导师、Nature、美国国会
  • 2025 IDEA大会沈向洋提出智能演进的五个维度:机会不仅来自技术本身
  • 基础架构的新探索:清华提出Step by Step Network
  • 罗永浩:当年如果不做 TNT,锤子科技有可能多撑几年;灵光上线 4 天下载突破 100 万;谷歌 AI 搜索出现赞助广告
  • AI半天顶博士6个月,奥特曼太激动!生化圈巨震
  • 别再问什么工作被AI取代!Karpathy直指本质:你的工作「可验证」吗?
  • Karpathy最新发文:醒醒!别把AI当人看,它没欲望也不怕死
  • 马斯克想要「杀死」氛围编程,就像FSD搞定自动驾驶
  • 硅谷今夜笑疯!马斯克自黑「傻胖子」,只因Grok硬捧他打赢泰森
  • 2025宝山·智能机器人产业大会暨嘉年华隆重开幕
  • 解放军总医院联合南大、吉大等机构,共同提出首个「脊柱诊疗大模型」SpineGPT
  • Anthropic发现AI「破窗效应」:只是教它偷个懒,结果它学会了撒谎和搞破坏
  • DeepMind招募波士顿动力前CTO,哈萨比斯点赞宇树
  • 把具身机器人开发变简单,地瓜机器人S600与一站式平台双擎亮相
  • Meta再推WorldGen,简单一句话,竟「盖」出50×50米一座城
  • 华为开源突破性技术Flex:ai,AI算力效率直升30%,GPU、NPU一起用
  • 腾讯混元数字人团队发布Moral RolePlay基准,揭秘大模型的「道德困境」
  • NeurIPS 2025 | MIT新研究:数据集蒸馏迎来“线性时代”,一张图顶半个ImageNet?
  • OpenAI联手菲尔兹奖得主与多位顶尖学者,首次公开GPT-5的科研真实战力
  • 美团宣布在全国建设「骑手公寓」;2026 款苹果 iPad Air 曝光;月之暗面被曝计划明年下半年 IPO
  • 具身智能「全明星日」来袭!智源组局30+行业掌门人,激辩机器人终极命题
  • 1分钟跑出数百预测!WeatherNext 2把短时预报带入小时级
  • GPT-5得分不到0.4!法律+金融最大规模基准:1.9万+专家评估准则
  • AGI真来了!谷歌Nano Banana Pro实测,设计师天塌了?
  • 2025智源具身开放日:共筑开源基石,抢占全球具身智能生态新高地
  • 核反应堆的「第一次心跳」:初创公司实现零功率临界,研发模式迈向轻量化
  • SGLang Diffusion震撼发布:图像视频生成速度猛提57%!
  • 小米汽车第 50 万辆整车下线;谷歌推出 Nana Banana Pro;华为正式推出乾崑境系列旗舰 | 极客早知道
  • 字节这个「消失」了几年的 App,悄悄杀回苹果商城排行榜
  • 解耦骨骼与体型,实现前所未有的动画真实感!Meta SAM 3D核心技术:开源人体参数化模型MHR
  • 遥感变化检测,ChangeDINO来了:DINOv3驱动,IoU、F1指标全面SOTA!
  • ​「数字分身」白菜价:每月 998 元,雇一个 AI 帮你直播 8 小时
  • 北京内推 | 小红书审核基础算法团队招聘增量预训练/RL/推理方向算法实习生
  • ICLR 2026吃瓜大赏:论文区在卷,审稿区在演,比春晚还热闹的五大名场面
  • AI离“可靠记忆”还有多远?HaluMem首次把记忆系统幻觉拆到操作级
  • 理想亮相广州车展:宣布推送全新VLA、AES辅助驾驶能力
  • 别问树模型了!死磕结构化数据,清华团队把大模型表格理解推到极限
  • Meta超级智能实验室又发论文,模型混一混,性能直接SOTA
  • 超越 VTM-RA!快手双向智能视频编码器BRHVC亮相NeurIPS2025
  • 刚刚!腾讯混元开源HunyuanVideo 1.5 元宝上线生视频能力
  • 两院院士增选结果揭晓:周志华、刘云浩当选科学院院士
  • 无需训练、只优化解码策略,DTS框架让大模型推理准确率提升6%,推理长度缩短23%
  • RoboChallenge组委会正式成立:具身智能真机评测迈入标准化共建时代
  • 210亿美元的幻觉?奥特曼投了一家核能初创
  • LeCun出局,Meta变天!Llama 4翻车大清洗,「学院派」大败退
  • 大模型上天、马斯克发射GPU?中国团队直接建「太空超算」
  • 图像模型今夜变天?谷歌刚刚泄露了「Nano Banana Pro」这张王牌
  • AI顶会ICLR最严新规:滥用AI的作者和审稿人,论文一律拒稿!
  • 谷歌Nano Banana Pro上线,深度结合Gemini 3,这下生成世界了
  • DeepSeek悄悄开源LPLB:用线性规划解决MoE负载不均
  • AAAI 2025 Oral | 火山引擎多媒体实验室提出VQ-Insight,AIGC视频画质理解大模型
  • OpenAI 的「群聊」,可能比你想得更重要!
  • 最大游戏up主也玩本地AI?让笔记本都能跑大模型的Parallax来了
  • 并行扩散架构突破极限,实现5分钟AI视频生成,「叫板」OpenAI与谷歌?
  • 字节张楠、张宏江、田渊栋······极客公园创新大会 2026 嘉宾阵容更新!
  • 为什么说在 AI 时代,「想象」比「记录」更费劲?
  • NEX:下一代能动性模型体系与开源生态
  • 很强很惊艳!Meta重磅开源SAM 3:可概念提示,统一检测、分割与追踪,性能提升2倍
  • 发布即产品!SAM 3D横空出世:Meta再次颠覆3D视觉,单图即可实现高精度三维重建
  • 本周六,围观学习NeurIPS 2025论文分享会,最后报名了
  • AI终于学会「读懂人心」,带飞DeepSeek R1,OpenAI o3等模型
  • 让移动不再成为噪声:搭载AI的新一代可穿戴传感实现高动态条件下的精准识别
  • SOTA集体掉线?美团AMO-Bench揭露大模型数学推理的真实段位
  • 百万步0失误!LLM首次跑通1,048,575步长任务,不崩、不偏、不掉链
  • 星动纪元获近10亿元A+轮融资!吉利资本领投,总订单额破5亿
  • 刚刚,Yann LeCun官宣离职创业,瞄准高级机器智能AMI
  • 分割一切并不够,还要3D重建一切,SAM 3D来了
  • 杨立昆宣布离开 Meta「自立门户」;荷兰暂停干预安世半导体;TikTok 将支持用户设置减少 AI 内容
  • 首个AI神作!一人分饰全角,万人围观外星人嘲讽人类灭绝
  • 申研「全拒得」的「差生」,终成PyTorch之父、Meta副总裁!今天跳槽TML
  • 图灵奖得主竟「忘了提及」中国学者成果?马库斯重锤Yann LeCun
  • 永别了,Tokenizer!何恺明师徒新作,颠覆AI生图技术
  • 年度最强AI实锤!谷歌Gemini 3全网首测震撼,一句话编码封王
  • 亚马逊云科技发布Kiro正式版:核心功能升级
  • 对话斑马口语:如何用 AI Agent 造出「超人类外教」?
  • 点击下载!中国科研人员AI使用率全面领跑:Wiley发布全新调研报告
  • 清华团队“密度法则”登上Nature子刊,揭示大模型高效化发展新规律
  • 风口浪尖中的小米汽车,创下国产新势力最快盈利速度
  • 何恺明团队再出手!将ARC视为视觉问题,ViT从零训练60.4%准确率,达到人类平均水平
  • CMU新作Co-Me:无需重训,VGGT长序列迎11.3倍加速!
  • 资深技术专家胡成文出任鼎犀智创CTO,共赴新材料智创未来
  • 如视发布空间大模型Argus1.0,支持全景图等多元输入,行业首创!
  • 登顶开源SOTA!上交大&小红书LoopTool实现工具调用任务的「数据进化」
  • NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法
  • NeurIPS 2025 | 上下文元学习实现不微调跨被试脑活动预测
  • 刚刚,PyTorch之父光速入职TML!离职Meta刚过一天,投身500亿估值独角兽
  • 何恺明重磅新作:Just image Transformers让去噪模型回归基本功
  • ConsistEdit来了:无需训练,实现高精度、高一致性的视觉编辑新范式
  • Gemini 3深夜来袭:力压GPT 5.1,大模型谷歌时代来了
  • 「30 秒造应用」——蚂蚁灵光点燃「所想即所得」的魔法时刻
  • 视频模型真在推理,还是「表演」推理?港中文等质疑:Chain-of-Frame是真的吗?
  • Gemini 3 正式发布,多榜单断崖式领先;美安全服务商网络中断,ChatGPT、X 受牵连;苹果承认酒精擦拭可能导致手机掉色|极客早知道
  • 4万亿刀,仅3.6万人!英伟达揭残酷真相:劳动正与财富大脱钩
  • 医疗AI智能体全面综述:行业爆发,年增长130%!
  • AI「看见」实验,哈佛颠覆性突破!一副AR眼镜,新手秒变资深专家
  • 震惊电影圈!好莱坞混了10年没出头,他把AI「烂片」做成23万粉爆款
  • Anthropic CEO:最快明年,一半初级白领下岗!失业率将达10%-20%
  • 谷歌 Gemini 3.0 深夜炸场:没有悬念的最强 AI
  • 夸克全面接入千问对话助手,将发布全新AI浏览器
  • MIT何恺明团队新作:让扩散模型回归“去噪”本质,简单Transformer即可实现SOTA性能
  • Yann LeCun团队新作LeJEPA:仅一个超参数、50行代码,实现可证明、可扩展的自监督学习
  • JSON刚死24小时,TOON又被网友玩坏:LLM数据格式彻底乱套了
  • 美团多篇论文入选NeurIPS 2025:从大模型到多模态的全线突破 | 直播预告
  • 阿里千问公测,挑战 ChaGPT;京东上线独立外卖 App;贝佐斯出任 AI 初创公司 CEO
  • 抱歉了GPT-5,这次是中国AI「上岸」了
  • 你急它不急:GPT-5先判断,再决定「速答」还是「深想」
  • Meta开始用KPI考核,强迫所有员工尽可能多使用AI
  • 接招吧,GPT-5.1!
  • 「前三代定律」下,百年吸尘器如何做出新意?
  • 两个月破 300 万用户,Agnes AI 刷新 Instagram 与 Snapchat 增长纪录
  • 每天给白领发 1000 万,他成了硅谷最年轻亿万富翁
  • 2025,中国科技圈进入全面「大乱斗」时代
  • 当 AI 开始分「左右」
  • 阿里云,用全栈 AI 刷新第十七个双十一
  • AAAI 2026 山大提出DiveSeg:为DINO注入“水下感知力”,实例分割性能提升显著
  • AAAI 2026 Oral MiniShift+Simple3D:面向高分辨率3D异常检测的可扩展数据集与实时检测新范式
  • 双重隐式记忆来了!JanusVLN让视觉语言导航真正理解3D空间
  • 让千问APP当一周科研打工人:它比我想的能干,也比我想的累
  • 雷军连发多条微博回应质疑;iPhone 发布方式将在明年重大变革;年度最令人不安的研究:AI 刷多社媒会变蠢|极客早知道

ICML 2025 | 联邦学习的“平衡艺术”:FedCEO破解隐私与效用的权衡困局

原创 让你更懂AI的 2025-11-22 09:12 北京

隐私要合规,效果要达标

当联邦学习遭遇 “两难抉择”:增加隐私噪声,还是维持模型精度?

某三甲医院与社区诊所正协同训练心脏病预测模型——前者拥有高清影像数据(如 CT、MRI 影像),可支撑细微病灶的精准识别,后者则积累了大量长期连续的基础生理数据(如实时心率、血压变化趋势)。

两类数据能形成关键互补,为模型提供 “静态病灶特征 + 动态病情监测” 的完整信息支撑。

然而棘手的是,患者数据隐私要求必须添加差分隐私(Differential Privacy,DP)噪声,但传统方案中,噪声强度略微增加 ,模型准确率就可能跌破临床可用阈值。

这正是联邦学习(Federated Learning)落地的典型困境:隐私与效用仿佛 “跷跷板”,顾此必失彼。

而 ICML 2025 最新收录的一篇来自中山大学、德州农工大学等团队的研究,提出了名为 FedCEO 的全新框架,首次用“客户端语义协同”的思路打破僵局 —— 并以数学证明给出保证:在隐私达标的前提下,模型效用依然优于现有方案。

论文标题:

Clients Collaborate: Flexible Differentially Private Federated Learning with Guaranteed Improvement of Utility-Privacy Trade-off

论文链接:

https://openreview.net/pdf?id=C7dmhyTDrx

Github 链接:

https://github.com/6lyc/FedCEO_Collaborate-with-Each-Other

行业死结:联邦学习的 “双重枷锁”

联邦学习以 “数据不动模型动” 的核心特性,成为隐私计算领域的关键技术,但在工业级场景落地时却面临较低的转化率,其根源在于两道难以突破的核心枷锁:

1. 隐私与效用的 “零和博弈”

为满足 GDPR、《个人信息保护法》等全球隐私合规要求,当前主流方案多采用差分隐私技术,通过在数据或模型参数中添加噪声来隐藏个体信息。然而,这种噪声不仅会破坏单一机构数据的语义完整性,更会削弱不同机构间数据的协同价值

例如医疗场景中,医院的病灶影像数据与社区诊所的长期生理监测数据本可形成 “静态特征 + 动态趋势” 的互补,但噪声可能导致两类数据的关联特征被掩盖,无法实现有效融合。

更关键的是,在多轮联邦通信过程中,噪声会持续累积,使得各机构不断传递的有用信息被逐步稀释,最终导致模型不仅难以达到预期准确率,还可能随着训练轮次增加出现 “效用衰减” 效应,无法充分发挥多源数据的互补优势。

2. 权衡效果的 “无据可依”

企业与机构在推进联邦学习项目时,最核心的顾虑在于 “隐私合规与业务效用的平衡边界无法界定”——既不清楚 “满足隐私要求时,模型能达到怎样的业务效果”,也无法确定 “想提升业务效用时,是否会突破隐私红线”。

这种不确定性在跨机构协作中尤为突出:不同类型机构对隐私与效用的优先级需求存在差异,例如金融机构更关注用户数据隐私是否符合监管标准,而医疗健康机构则更看重模型对疾病诊断的准确性,但由于缺乏明确的理论保障和量化依据,双方难以达成一致的协作方案。

不少跨领域项目正因这种 “无据可依” 的试错困境被迫搁置 —— 机构既不敢随意调整隐私参数,担心合规风险,也不敢盲目追求效用提升,害怕投入资源后无法达到业务目标,最终导致多源数据的互补价值难以转化为实际业务成果。

FedCEO 的技术突破:基于客户端语义动态协同的联邦学习新范式

1. 张量低秩优化:多客户端语义空间的协同平滑

传统差分隐私联邦学习方案在参数注入噪声后,易导致各客户端语义空间出现异质性偏差,且缺乏有效调和机制,使得模型效用随噪声累积持续衰减。

FedCEO 通过张量结构构建多客户端语义关联表征,形成语义空间协同平滑框架:将各客户端上传的含噪声模型参数构建为高阶张量,借助张量对多源语义关联的天然表征优势,强化不同客户端语义空间的一致性。

具体而言,通过张量奇异值分解(T-tSVD)算法提取张量中的低频语义关联成分(如跨机构数据中蕴含的共性任务特征),强化该部分语义信息的全局一致性,进而平滑高频噪声引发的局部语义波动(如监测数据中的随机扰动信号对语义表达的干扰)。

无需直接分离噪声成分,而是通过语义空间的协同统一弱化噪声对全局模型的影响。在典型任务场景中,该机制可有效缓解因噪声注入导致的模型语义空间异质性,恢复语义表达的完整性,显著提升模型效用。

2. 自适应平滑机制:基于语义空间状态的动态调节

针对联邦学习多轮通信过程中,噪声累积引发语义空间异质性逐步加剧的问题,FedCEO 设计了基于几何级数变化的动态截断阈值调节策略,实现语义空间平滑程度的按需适配

具体调节逻辑包括:

在训练初期,噪声累积量较小,语义空间异质性较弱,采用较小的截断阈值以保留各客户端语义信息的细粒度特征,避免过度平滑导致的语义损失。

随着通信轮次增加、噪声累积量上升,语义空间异质性加剧,动态增大截断阈值以强化低频语义关联的聚合强度,进一步平滑噪声引发的语义偏差。

同时,根据隐私需求的严苛程度(即隐私预算 ε 的取值)动态调整阈值系数 λ,当隐私要求更高(ε 取值更小时),降低 λ 以提升语义空间的稳定性,确保在强化隐私保护的同时,维持语义表达的一致性。

该自适应调节机制可确保在整个训练周期内,模型通过语义空间的动态平滑,始终维持隐私保护强度与效用性能的平衡。

此外,论文中证明当正则系数/截断阈值固定在某个值附近时,FedCEO 将会退化为 FedAvg,即 FedAvg 是论文方法的一种特殊形式

3. 理论双保障:语义平滑下的效用 - 隐私量化边界证明

该研究的核心学术贡献之一,是首次基于凸优化理论,结合语义空间平滑机制,完成联邦学习中效用 - 隐私权衡的量化边界证明,为技术落地提供明确的理论依据,形成两大关键定理:

其一为效用下界定理,证明在给定隐私预算及语义空间平滑约束下,模型的效用损失上界为 O(√d/K)(其中 d 表示输入特征维度,K 表示参与协同的客户端数量)。

相较于过去的最优方案(如 CENTAUR 的效用损失上界 O (d)),其效用损失降低幅度可达 √d 倍,且该优势在高维度输入数据(如图像、高维传感器数据)场景下更为显著 —— 此类数据语义空间更易受噪声干扰,平滑机制的效用提升作用更突出;

其二为隐私上界定理,证明该框架严格满足 (ε, δ)- 差分隐私((ε, δ)-DP),且隐私预算 ε 可通过量化公式 ε= c₂K√(Tlog (1/δ))/(Nσ) 精准计算,支持企业根据合规要求反向推导所需的噪声注入强度,同时确保语义空间平滑机制不突破隐私边界。

该理论证明为联邦学习的工业落地提供了明确的量化依据,有效降低了方案验证过程中的试错成本。

实验验证:FedCEO 在效用、隐私与权衡性维度的优越性分析

基于联邦学习典型任务场景,通过与传统差分隐私联邦学习方案(如 UDP-FedAvg、PPSGD、CENTAUR)的对照实验,从效用、隐私、权衡性三个核心维度,验证 FedCEO 依托语义空间平滑机制实现的性能突破。

实验设计聚焦 “机制有效性 - 场景适配性 - 理论一致性” 三重目标,结果如下:

1. 效用维度:语义平滑驱动的模型泛化能力提升

传统差分隐私联邦学习方案因噪声注入导致各客户端语义空间异质化,全局模型难以聚合一致的有效信息,在跨客户端、跨任务场景中泛化性能显著衰减。

FedCEO 通过张量低秩优化与自适应平滑机制,实现多客户端语义空间的协同统一,从而提升模型效用

2. 隐私维度:语义平滑赋能的隐私保护效率优化

FedCEO 的隐私优越性并非依赖 “过量噪声注入”,而是通过语义空间平滑机制优化隐私保护逻辑 —— 在弱化个体数据特异性的同时,避免噪声对全局语义的过度破坏,实现 “更精准的隐私保护”

3. 权衡性维度:效用-隐私的协同优化突破零和困境

传统差分隐私联邦学习的核心瓶颈在于 “效用 - 隐私零和博弈”—— 隐私保护强度提升必然伴随效用显著下降,而 FedCEO 依托语义空间平滑机制,实现两者的协同优化,其权衡性优势体现在两方面:

权衡边界更优:在不同隐私预算梯度(从宽松到严苛)的对照实验中,传统方案的效用损失随隐私预算降低呈线性增长,而 FedCEO 因语义平滑对噪声影响的弱化作用,效用损失速率显著放缓。

在相同隐私预算下,效用损失幅度仅为传统方案的 1/2~2/3,证明其能以更低的效用代价实现更高的隐私保护强度;同时,在效用目标固定场景中,FedCEO 所需的隐私预算更宽松,为实际应用中 “效用达标 + 隐私合规” 提供更大调整空间。

理论与实验一致性验证:实验结果与 FedCEO 的效用下界定理、隐私上界定理高度吻合 —— 在输入维度递增场景(从低维数值到高维图像)中,效用损失降低幅度符合 O (√d/K) 的理论推导,隐私强度始终满足 (ε, δ)-DP 的量化约束。

证明其效用 - 隐私权衡性并非依赖实验参数调优的偶然结果,而是由语义平滑机制与理论框架共同保障的必然优势,为工业落地提供 “理论可证 + 实验可验” 的双重信任基础。

未来:从 “灵活协作” 到 “全域兼容”

联邦学习的终极目标不是让设备适应系统,而是让系统服务设备。当隐私与效用不再对立,当手机、传感器、服务器能自由协同,一个更高效、更安全的分布式智能生态,正在加速到来。

此外,作者认为:当前联邦学习中存在的各种挑战(包括数据异构以及隐私保护等等)本质上都可以归结为客户端间的语义不协同问题。如果从更高维度出发对客户端信息聚合进行建模,说不定可以统一解决 FL 中存在的各类问题。

未来,研究者计划推出联邦张量学习(Federated Tensor Learning,FTL)框架,期望以灵活地客户端间语义协同范式统一解决FL中的各类异构以及隐私-效用问题。

更多阅读

#投 稿 通 道#

让你的文字被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

阅读原文

跳转微信打开

联系我们