动态列表

OpenAI「GPT门」事件引爆！Plus、Pro账户统统降配，偷换模型全网实锤
突发，普林斯顿CS博士后猝然离世！清华本科毕业，刚完成论文答辩
国内首次！8.9毫秒推理速度破纪录，1元打穿百万token
惊现高管离职潮！马斯克亲信操盘xAI，千亿美元能填AGI野望？
黄仁勋2小时反驳「AI泡沫帝国」论！英伟达将成全球首家十万亿市值公司
云与AI，如何托举 Z 世代的创新野心
8GB显卡的逆袭！SSD换显存，3060 Ti硬跑100k长上下文
北京/杭州内推 | 阿里通义实验室招聘多模态大模型与智能体方向算法实习生
NeurIPS 2025 | 北大等提出C²Prompt：解耦类内与类间知识，破解联邦持续学习“双重遗忘”难题
InterDigital开源CompressAI-Vision：为“AI看”的视频压缩，打造一个“通用跑分平台”
24.98万的理想i6，在特斯拉、小米、蔚来「后院」放了一把火
小米 17 开售 5 分钟，破国产机销售纪录；Meta 研发机器人项目；国内发布「脑机接口标准」
Stability AI前CEO惊人预测：人类智力价值归零，只剩1000天！
刚刚，奥特曼预言：人类「只剩」最后5年！
免训练加速61倍！陈怡然团队新作DPad：仅关注「彩票token」
估值840亿AI实验室再放大招，他们要给大模型戴上「紧箍咒」
苹果掀桌！扔掉AlphaFold核心模块，开启蛋白折叠「生成式AI」时代
自动驾驶进入大模型时代，主机厂寻找「联合创始人」
复旦等揭秘机器人“大脑”安全漏洞：一张图就能让它“宕机”，攻击成功率76.2%
DASFAA 2025 | 湖大等提出SCRA-VQA：给LLM一份“精装修”的图像描述，无需训练提升VQA性能
苹果官方旗舰店也放假，商品不发货；腾讯推「老年打车」服务；车主酒驾，智能驾驶「报警」｜极客早知道
刚刚，ChatGPT Pulse上线！私人秘书不再是富人特权
颠覆算力格局！全球首个星座级太空AI算力服务，在中国诞生
OpenAI 3万亿美元测试，AI首战44个行业人类专家！
JHU教授揭秘学术潜规则：普通博士如何打破鄙视链翻盘？
Hinton预言错了！年薪狂飙52万美元，AI没有「干掉」放射科医生
168 元一年的「小红卡」，是小红书打破本地生活红海的钥匙
当 5 亿玩家涌入 AI 的 3D 新世界
博士申请 | 香港中文大学（深圳）冀晓强老师课题组招收人工智能全奖博士/硕士
128k死穴被击穿！Amazon爆改长上下文：段内压缩快4×，推理不掉点还更准
普林斯顿陈丹琦组新作：RLHF难支撑，RLVR有边界？RLMT开辟第三条路
AI 到底会不会做生意？1688 的答案让人惊喜
找人不求人？Lessie 让「人脉玄学」变成算法游戏｜AI 上新
斯坦福推出VisualMimic：让机器人“眼观六路”，零样本完成复杂任务
浙大发布RS3DBench：让遥感AI看懂3D世界，首个像素级对齐的大规模基准来了！
小米 17 系列发布，4499 起；追觅「库里南」图片曝光；YU7 Max 成「百万最速」车
刚刚，LeCun团队开源首款代码世界模型！能像程序员一样思考的LLM来了
AI正在偷走白领工作！OpenAI狂砸10亿教AI上班，你的完美继任者即将上岗
Sora 2瑟瑟发抖！通义万相2.5放大招：一句话出1080P电影，音画精准同步
信息熵之后，清华提出状态熵！量化分析「系统智能性」的全新视角
突发！Meta刚从OpenAI挖走了清华校友宋飏
KV缓存不再爆！清华姚期智团队重写注意力维度，长上下文更省更强 | NeurIPS 2025 Spotlight
78条打穿1万条！上交大新范式告诉你：智能体训练靠“质”，不是靠“量”
北京内推 | 中科院软件所数据科学研究中心招聘大语言模型算法实习生
三款骁龙芯片曝光，高通谷歌联手打造「安卓 PC」时代
Instagram 月活破 30 亿，靠“短视频”和“私信”；2027款iPhone曝光；女子用ChatGPT选号中百万大奖，全部捐出
一年4次迭代，狂堆GPU成真！微软AI冷液灌芯，散热暴涨3倍
刚刚，阿里CEO吴泳铭发布「ASI宣言」：超级智能才是终局！
前Meta工程师爆料：17人团队15个H-1B！一夜之间80%对手没了？
秘塔AI放大招！「边想边搜边做」，内置20+智能体，想法一键实现
震撼！AI物理「双修」：亥姆霍兹方程嵌进生成器，伪影当场消失
恶劣天气下的图像修复：南理工等提出LCDiff，让AI在雨雪雾天也能看得清
OCRBench v2 25年9月最新榜单发布！揭示多模态大模型文档智能真实水平
博士申请 | 加拿大麦吉尔大学智能自动化实验室招收大模型/强化学习方向全奖博士生
NeurIPS 2025 | 甩掉文本CoT！FSDrive开启时空思维链，自动驾驶迈入视觉推理时代
RL不再撒胡椒面！港科大 × 清华新作：只盯“规划token”，大模型推理力狂飙
3 天卖完今年所有产能，蔚来全新 ES8 如何实现逆风翻盘？
超越 AGI，阿里剑指「超级智能」
Point-SSM：一种用于点云分析的极简状态空间模型，在医学点云任务上表现SOTA
字节跳动OmniInsert炸场：无需掩码，任意物体“贴”进视频，效果碾压闭源SOTA！
ContextFlow：无需训练的视频编辑新范式，实现电影级魔改！
忘了法拉利，一辆中国车正在改写游戏规则
40亿投进去，换回了什么？全新问界M7的「值得」哲学
华为问界新 M7，1 小时大定 3 万；李想：iPhone 17 顶配太丑，不买；防台风，腾讯「捆绑」QQ 企鹅塑像
一半人明天不上班，GDP不会掉一点！耶鲁大学揭AGI残酷真相
告别胶水代码，5倍飚速！无问芯穹首次揭秘，Infra智能体蜂群登场
Depth Anything再出新作！浙大 & 港大出品：零样本，优化任意深度图
H-1B「天价签证」引爆恐慌！印裔精英返乡梦碎，2800亿市场剧震
突发：甲骨文CEO下台！刚和OpenAI签下3000亿美元大单，或因路线斗争
年轻一代创作者，学会与 AI 共舞
KDD 2025 | 从个股偏离到市场共振：UMI挖出股市非理性因子，显著提升预测精度
北京内推 | Apple中国招聘机器学习/AI方向研究型实习生
一套框架搞定图像定制！IC-Custom统一「位置相关/无关」，万物迁移真落地
MiniCPM-V 4.5技术报告正式出炉！首个高刷视频理解多模态模型全解析
TPAMI | 数据增强还在“盲操”？南大提出IPF-RDA，让模型训练告别信息丢失
SilentStriker：无声击溃大模型
Yann LeCun团队新作LLM-JEPA：结合联合嵌入预测架构，显著提升大模型微调性能与效率，在代码生成任务上表现卓越
小米 17 系列手机官宣 9 月 25 日发布；iPhone 17 标准款需求超预期，苹果已增产；罗永浩再回应债务问题：个人债务五年前就还完了，后面是主动还的公司债务｜极客早知道
比思维链准43%！逻辑脑+大模型直觉，推理可靠性大幅提升
陶哲轩官宣AI数学基金首轮名单：29个项目瓜分1.3亿，数学界沸腾！
GPT-5仅23.3%，全球AI集体挂科！地狱级编程考试，夺金神话破灭
一手奶瓶一手键盘！新手宝妈产假氛围编程，自研实用家庭App
刚刚，DeepSeek-V3.1「终极版」重磅发布！最大提升超36%，V4/R2还远吗？
为了千元机用户的「流畅权」，OPPO 为安卓换了个「引擎」
一年卖出 10 个亿，这是年轻人真正的「户外神器」
Teable 宣布完成数百万美元天使轮融资，让数据库「长出耳朵和手」
北京内推 | 智源研究院多模态交互研究中心招聘多模态/具身智能方向研究型实习生
博士申请 | 复旦大学魏龙老师课题组招收AI4Science方向博士/硕士/RA/实习生
Lumos-1登场！自回归 + 离散扩散合体：让大模型真正“构造”动态世界！
RLHF要下岗？Meta × 牛津搞出新套路：用算力教算力，大模型训练新范式来了！
不到两千块，我拍到了专业级别的月全食｜New Things
字节跳动SAIL-VL2登顶OpenCompass，开源高效多模态新标杆
苹果发布Manzano：一种简单可扩展的统一多模态大模型，其混合视觉Tokenizer统一了理解与生成任务，性能SOTA
博后年薪40万到90万 | 东方理工朱文韬课题组招聘AI方向博士后、研究助理教授、访问学生、实习生
黄仁勋出手，50 亿美元入股英特尔，英伟达一统「GPU+x86」生态
巴菲特清仓比亚迪，期间股价上涨 38 倍；苹果折叠屏手机细节曝光；雷军年度演讲定档 9 月 25 日

NeurIPS 2025 | 我奶奶都能复现？条件表征学习：矩阵一乘，表征立马“对齐”！

2025-09-28未知作者来源

原创让你更懂AI的 2025-09-28 13:35 北京

复现门槛=零

还在为表征学习只看见“表面信息”而头疼吗？在电商、搜索、检索等实际场景中，我们往往需要的不仅仅是“这是大象”，而是包括环境、颜色、材质、场合在内的多维信息。

但传统方法往往只能给出单一标签。本文提出的条件表征学习（CRL），只需一次简单的矩阵投影，就能让模型快速对齐指定准则，生成更有解释力的表征。更关键的是——几乎零训练成本，复现难度低到“我奶奶都能跑”。

这项工作以“Conditional Representation Learning for Customized Tasks”为题，被正式录用为 NeurIPS 2025 Spotlight。

背景

一张图片包含的信息是多维的。例如下面的图 1，我们至少可以得到三个层面的信息：主体是大象，数量有两头，环境是热带稀树草原（savanna）。

然而，如果由传统的表征学习方法来处理这张图片，比方说就将其送入一个在 ImageNet 上训练好的 ResNet 或者 Vision Transformer，往往得到的表征只会体现其主体信息，也就是会简单地将该图片归为大象这一类别。这显然是不合理的。

▲ 图1：传统表征学习（上）与条件表征学习（下）的比较。传统的表征学习方法只能学习到一种通用的表征，忽略了其他有意义的信息；文章提出的条件表征学习能够基于指定准则，得到该准则下表现力更强的条件表征，适应多种下游任务。

此外，在各大电商平台，用户通常根据不同的标准（例如颜色、材质或场合）搜索商品。例如，用户今天可能搜索“红色连衣裙”，明天搜索“正装”，后天搜索某个全新的关键词。这对于拥有庞大规模商品的平台来说，手动打标签是不现实的，而传统的表征学习也仅仅只能获取到“连衣裙”这个层面的信息。

要获取图片中除了“大象”、“连衣裙”之外的信息，一个很容易想到的方法就是进行针对性的有监督训练：基于不同的准则比如环境，进行额外的标注，再从头训练或者基于已有表征训练一个额外的线性层。

但是基于这种方式，显然是“治标不治本”的。因为一旦有了新的需求，便又需要进行针对性的数据收集、标注和训练，需要付出大量的时间和人力成本。

很幸运的，我们处在多模态大模型的时代，这个在以前可能会很困难的问题在今天是有很多解法的。我们可以直接通过询问 LLaVA，它便会告诉我们图片在指定准则下的信息。

但这种方式也还不够高效，至少在 2025 年的今天，多模态大模型的使用成本还是需要考虑的。如果需要处理 ImageNet 之类的大规模数据集或者电商平台繁杂的商品，得到其在指定准则下的信息，这个开销就比较大了。所以对大多数人来说，现如今要获取图片的多维信息，还是需要找到一个更加高效的方法。

方法

我们知道，对于三维直角坐标系，一组基，比如 [(1, 0, 0), (0, 1, 0), (0, 0, 1)]，其线性组合即可构建出该坐标系中的任何向量。类似的，对于颜色体系，只需要“红”、“绿”、“蓝”三原色即可调出所有的颜色。

受此启发，我们想到，是否对于任意一个给定的准则，也存在着一个对应的“概念空间”及其基？如果能在这个空间中找到一组基，那么我们只需要将原始表征投影到该空间上，理论上就能获得在该准则下更具表现力和判别性的特征。

找到给定准则对应的基，这听起来有些困难。但没关系，我们不需要很准确地找到，只需要接近它就好。

基于这个想法，论文提出了一种即插即用的条件表征学习方法。如图 2 所示，给定准则（例如“颜色”），CRL 首先让大语言模型 LLM 生成该准则相关的描述文本（例如“红色”，“蓝色”和“绿色”等）。

随后，CRL 将由 VLM 得到的通用图片表征，投影到由描述文本张成的空间中，得到该准则下的条件表征。该表征在指定的准则下表达更充分，并且具有更优的可解释性，能有效适应下游定制化任务。

▲ 图2：所提出的条件表征学习（CRL）的总体框架。图中以通用表征空间（准则为隐式的“形状”）转换到“颜色”准则空间为例。

直白地说，只需要将对齐的图片和文本表征，做个矩阵乘法就好了，甚至不需要训练。复现难度约等于——

实验

分类和检索任务是衡量表征学习性能的两个经典下游任务。论文在两个分类任务（少样本分类、聚类）和两个检索任务（相似度检索、服装检索）上进行了充分的实验验证，部分实验结果如下：

▲ 图3：分类任务

▲ 表1：所提出的 CRL 在少样本分类任务上的性能

▲ 表2：所提出的 CRL 在聚类任务上的性能

▲ 图4：相似度检索任务。上为 “Focus on an object”（Focus），下为 “Change an Object”（Change）。

▲ 表3：所提出的 CRL 在相似度检索任务上的性能

▲ 图5：服装检索任务

▲ 表4：所提出的 CRL 在服装检索任务上的性能。

从上述结果中可以看出，CRL 可以作为一个即插即用的模块，与现有多模态方法相结合，在不同准则下，其得到的条件表征在下游任务中都取得了比原表征更加优异的表现，性能甚至超过了对应领域的专用方法。更多实验可参见论文。

总结

与传统的表征学习只得到单一的通用表征不同，本文提出了条件表征学习，通过获取指定准则下的文本基，并将图像表征投影到该文本基张成的空间中，即可得到该准则下表现力更强的条件表征，以更好地适应各种下游任务。

更多阅读

#投稿通道#

让你的文字被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个，让知识真正流动起来。

📝 稿件基本要求：

• 文章确系个人原创作品，未曾在公开渠道发表，如为其他平台已发表或待发表的文章，请明确标注

• 稿件建议以 markdown 格式撰写，文中配图以附件形式发送，要求图片清晰，无版权问题

• PaperWeekly 尊重原作者署名权，并将为每篇被采纳的原创首发稿件，提供业内具有竞争力稿酬，具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道：

• 投稿邮箱：hr@paperweekly.site

• 来稿请备注即时联系方式（微信），以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信（pwbot02）快速投稿，备注：姓名-投稿

△长按添加PaperWeekly小编

🔍

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

阅读原文

跳转微信打开

动态列表

NeurIPS 2025 | 我奶奶都能复现？条件表征学习：矩阵一乘，表征立马“对齐”！

类别

资源

联系我们