动态列表

一年4次迭代，狂堆GPU成真！微软AI冷液灌芯，散热暴涨3倍
刚刚，阿里CEO吴泳铭发布「ASI宣言」：超级智能才是终局！
前Meta工程师爆料：17人团队15个H-1B！一夜之间80%对手没了？
秘塔AI放大招！「边想边搜边做」，内置20+智能体，想法一键实现
震撼！AI物理「双修」：亥姆霍兹方程嵌进生成器，伪影当场消失
OCRBench v2 25年9月最新榜单发布！揭示多模态大模型文档智能真实水平
恶劣天气下的图像修复：南理工等提出LCDiff，让AI在雨雪雾天也能看得清
NeurIPS 2025 | 甩掉文本CoT！FSDrive开启时空思维链，自动驾驶迈入视觉推理时代
博士申请 | 加拿大麦吉尔大学智能自动化实验室招收大模型/强化学习方向全奖博士生
RL不再撒胡椒面！港科大 × 清华新作：只盯“规划token”，大模型推理力狂飙
3 天卖完今年所有产能，蔚来全新 ES8 如何实现逆风翻盘？
超越 AGI，阿里剑指「超级智能」
Point-SSM：一种用于点云分析的极简状态空间模型，在医学点云任务上表现SOTA
字节跳动OmniInsert炸场：无需掩码，任意物体“贴”进视频，效果碾压闭源SOTA！
忘了法拉利，一辆中国车正在改写游戏规则
40亿投进去，换回了什么？全新问界M7的「值得」哲学
华为问界新 M7，1 小时大定 3 万；李想：iPhone 17 顶配太丑，不买；防台风，腾讯「捆绑」QQ 企鹅塑像
一半人明天不上班，GDP不会掉一点！耶鲁大学揭AGI残酷真相
告别胶水代码，5倍飚速！无问芯穹首次揭秘，Infra智能体蜂群登场
Depth Anything再出新作！浙大 & 港大出品：零样本，优化任意深度图
H-1B「天价签证」引爆恐慌！印裔精英返乡梦碎，2800亿市场剧震
突发：甲骨文CEO下台！刚和OpenAI签下3000亿美元大单，或因路线斗争
年轻一代创作者，学会与 AI 共舞
一套框架搞定图像定制！IC-Custom统一「位置相关/无关」，万物迁移真落地
北京内推 | Apple中国招聘机器学习/AI方向研究型实习生
KDD 2025 | 从个股偏离到市场共振：UMI挖出股市非理性因子，显著提升预测精度
MiniCPM-V 4.5技术报告正式出炉！首个高刷视频理解多模态模型全解析
Yann LeCun团队新作LLM-JEPA：结合联合嵌入预测架构，显著提升大模型微调性能与效率，在代码生成任务上表现卓越
SilentStriker：无声击溃大模型
TPAMI | 数据增强还在“盲操”？南大提出IPF-RDA，让模型训练告别信息丢失
小米 17 系列手机官宣 9 月 25 日发布；iPhone 17 标准款需求超预期，苹果已增产；罗永浩再回应债务问题：个人债务五年前就还完了，后面是主动还的公司债务｜极客早知道
比思维链准43%！逻辑脑+大模型直觉，推理可靠性大幅提升
陶哲轩官宣AI数学基金首轮名单：29个项目瓜分1.3亿，数学界沸腾！
GPT-5仅23.3%，全球AI集体挂科！地狱级编程考试，夺金神话破灭
一手奶瓶一手键盘！新手宝妈产假氛围编程，自研实用家庭App
刚刚，DeepSeek-V3.1「终极版」重磅发布！最大提升超36%，V4/R2还远吗？
为了千元机用户的「流畅权」，OPPO 为安卓换了个「引擎」
一年卖出 10 个亿，这是年轻人真正的「户外神器」
Teable 宣布完成数百万美元天使轮融资，让数据库「长出耳朵和手」
北京内推 | 智源研究院多模态交互研究中心招聘多模态/具身智能方向研究型实习生
博士申请 | 复旦大学魏龙老师课题组招收AI4Science方向博士/硕士/RA/实习生
Lumos-1登场！自回归 + 离散扩散合体：让大模型真正“构造”动态世界！
RLHF要下岗？Meta × 牛津搞出新套路：用算力教算力，大模型训练新范式来了！
不到两千块，我拍到了专业级别的月全食｜New Things
博后年薪40万到90万 | 东方理工朱文韬课题组招聘AI方向博士后、研究助理教授、访问学生、实习生
苹果发布Manzano：一种简单可扩展的统一多模态大模型，其混合视觉Tokenizer统一了理解与生成任务，性能SOTA
字节跳动SAIL-VL2登顶OpenCompass，开源高效多模态新标杆
黄仁勋出手，50 亿美元入股英特尔，英伟达一统「GPU+x86」生态
巴菲特清仓比亚迪，期间股价上涨 38 倍；苹果折叠屏手机细节曝光；雷军年度演讲定档 9 月 25 日
刚刚，Gemini「灵魂人物」官宣加盟xAI！马斯克火速转推背书
靠10万+粉丝，北漂插画师秒贷款！华为全栈AI加速，让银行及时看见
醒醒，LLM根本没有性格！加州理工华人揭开AI人格幻觉真相
哈佛大佬都哭了！H-1B签证飙至10万刀，微软谷歌连夜召回全球员工
马斯克xAI百天血战，100天狂招100人！联创实权被削，豪言干掉微软
全球双榜SOTA！明略科技专有大模型 Mano开启GUI智能操作新时代
谷歌Gemini IMO和ICPC夺金功臣之一被xAI挖走，马斯克直呼：起飞
工业级3D世界构建提速90倍！全新框架LatticeWorld让虚拟世界「一句话成真」
集合通信库VCCL释放GPU极致算力，创智、基流、智谱、联通、北航、清华、东南重磅开源
告别视频“抽帧”理解，美国东北大学新算法GRT算法实现高效可扩展的高帧率密集视频理解
【招生招聘】阿卜杜拉国王科技大学孟彦达博士组全奖博士、博后、实习、交流生
iPhone17 卖爆，官网发货延至双 11；比亚迪仰望 U9 赛道版开启预定；网友玩坏 iPhone「舌头刷抖音」
「逆龄大脑药」首次人体试验！奥特曼押注RTR242，返老还童将要成真？
终结CMU霸权，清华首次登顶CSRankings世界第一！北大AI领域夺冠
大模型训练新突破！Meta提出LSP：无数据也能实现能力飞升
OpenAI最新硬件2026年底亮相！狂挖苹果20+老将，首款神秘设备或将颠覆iPhone
小扎AI眼镜当场死机，CTO自曝灾难级演示内幕：一个指令干趴自家服务器
当大厂「卷」Agent，腾讯选择「下产线」
陈天桥旗下AI公司MiroMind打造全球顶尖预测型大模型，性能登顶行业基准
OpenAI从苹果挖了20多人搞硬件，知情人士：苹果创新缓慢、官僚主义令人厌倦
Mini-Omni-Reasoner：实时推理，定义下一代端到端对话模型
北大等提出BEVUDA++，首次解决BEV感知跨域难题，夜间检测性能提升12.9%
TPAMI 2025 | DiffMVS/CasDiffMVS：一种置信度感知的扩散模型，实现轻量且准确的多视图立体三维重建
iPhone 17 Pro 首日即现划痕；传 OpenAI 联手立讯做 AI 硬件；2025 年搞笑诺贝尔出炉
史上最大升级！7亿周活ChatGPT逼宫，谷歌慌了，这次要把AI整个塞进Chrome
谷歌AI或摘千禧年大奖！华人博士破解百年数学难题，首次捕获奇点
登顶多模态推理榜MMMU！UCSD新方法超越GPT-5、Gemini
DeepSeek-R1登顶Nature，8位专家严审通过，大模型「交卷时刻」来了
18岁天才少年，登上Nature封面！
扩散大语言模型也能飞？DPad免训练加速61倍，全局规划照样稳
北京内推 | 腾讯混元大模型X团队招聘大模型/强化学习方向“青云计划”实习生
ICML 2025 | 乱写Prompt更给力？删几个Token，上下文学习立刻“反向觉醒”
不要ViT也不要扩散！OneCAT甩掉编码器，统一多模态自回归模型来了
华为超节点：用「一台机器」的逻辑，驱动AI万卡集群
5555被拒稿，AC接收但PC强拒，NeurIPS揭榜引争议
超强开源模型Qwen3、DeepSeek-V3.1，都被云计算一哥「收」了
攻克大模型训推差异难题，蚂蚁开源新一代推理模型Ring-flash-2.0
给大模型「精准手术」：美团智能客服提出逆向学习技术精准纠偏，风险控制提升38%
阿联酋大学CVLab IEEE Fellow团队招收2026春季/秋季全奖博士生
Meta新作SyncSeal：用深度学习“封印”同步信息，让数字水印不再怕裁剪和旋转
千禧年大奖难题有望突破？AI为流体动力学提供新思路
生物学迎来「ChatGPT时刻」：Evo构建首个AI生成的「基因组」，开启生成式基因设计时代
英伟达50亿美元入股英特尔，将发布CPU+GPU合体芯片，大结局来了？
理解帮助生成？RecA自监督训练让统一多模态模型直升SOTA
投50亿美元，英伟达联手英特尔；谷歌将Gemini加入浏览器；网约车司机平均月入过万
GPT-5攻入数学圈，证明定理快过博士生？网友热议AI新角色
阿里王牌Agent横扫SOTA，全栈开源力压OpenAI！博士级难题一键搞定
ChatGPT负责人深度复盘，爆4o复活内幕！过快下线是失误，将迭代模型人格
全球首个AI基因组诞生，35亿年生命代码重编程！生物学迎「ChatGPT时刻」
芯片大地震，黄仁勋355亿入股！英特尔要为老黄造CPU，股价狂飙30%
新思科技中国30周年，引领AI智能体工程师重塑芯片设计范式
科大讯飞发布面向东盟的多语言大模型及系列产品，布局中国—东盟AI生态大未来
Nature | 20年后你会患上哪些疾病？AI准确预测超1000种疾病患病风险，助力预防
我们还是低估了英伟达
北京内推 | 字节跳动国际电商团队招聘大模型方向算法实习生
少样本不够看？给LLM装上“学习引擎”，上下文学习迈入千样本时代
ICCV 2025 | Gap即力量！挖掘模态间隔潜力，MG-CLIP实现持续学习SOTA
谁在拖慢你的RL？别怪显卡，错的可能是你的PG-loss
OneSearch，揭开快手电商搜索「一步到位」的秘技
17.38 万的大六座 SUV，吉利用银河 M9 敲碎了友商的心
刚刚，OpenAI在ICPC 2025编程赛上满分登顶，Gemini也达到金牌水平
从一个公众号智能体说起：好用的Agent，究竟需要什么?
B站出海的强有力支柱：最新开源文本转语音模型IndexTTS-2.0标志零样本TTS进入双维度时代
腾讯企点营销云发布Magic Agent，营销工具全面AI化
带屏 AI 眼镜登场！Meta「眼镜全家桶」炸街了
通义DeepResearch震撼发布！性能比肩OpenAI，模型、框架、方案完全开源
让机器人「不只是走路」，Nav-R1引领带推理的导航新时代
刚刚，DeepSeek-R1论文登上Nature封面，通讯作者梁文锋
腾讯 AI 的新叙事

ContextFlow：无需训练的视频编辑新范式，实现电影级魔改！

2025-09-24未知作者来源

CV君 2025-09-24 17:33 江苏

视频编辑，原来可以这么简单。

今天给大家聊一个好玩又实用的技术，来自北大和港科大的朋友们提出来的一个叫 ContextFlow 的新模型。简单说，它能让你像P图一样轻松编辑视频里的物体，比如凭空加个东西、把A换成B，或者直接让某个物体消失，而且全程 无需训练！效果嘛，可以说是相当惊艳，不仅画面真实，而且前后帧连贯，毫无破绽。

想象一下，给视频里的赛车换个酷炫的涂装，或者让一只恐龙出现在你的后院，是不是很酷？这就是ContextFlow想干的事。

论文标题: ContextFlow: Training-Free Video Object Editing via Adaptive Context Enrichment
作者: Yiyang Chen, Xuanhua He, Xiujun Ma, Yue Ma
机构: 北京大学；香港科技大学
论文地址: https://arxiv.org/abs/2509.17818
项目主页: https://yychen233.github.io/ContextFlow-page

当前的困境

在ContextFlow出来之前，视频编辑这事儿其实挺折腾的。主要有两大难点：

保真度差：很多方法在编辑视频时，为了把新东西加进去，得先对视频进行一次“逆向工程”（Inversion），把它变成一堆“噪音”，然后再从噪音变回编辑后的视频。但这个过程，尤其是基于传统DDIM的方法，是有损的，就像一张图片传来传去会变模糊一样。这就导致最终还原的视频背景可能都变样了，更别提精准编辑了。
上下文冲突：更早的一些方法比较“暴力”，直接在模型的特征层进行“硬替换”（Hard Replacement）。这就像给一张照片打补丁，虽然把新东西放上去了，但这个“补丁”和周围的环境格格不入。在视频里，这就导致编辑的物体看起来像是“贴”上去的，光照、阴影、动态都对不上，非常假。

尤其是在现在流行的Diffusion Transformers (DiTs)架构上，这些问题更头疼，因为DiT的内部结构和之前的U-Net不一样，之前那些“凭经验”的编辑技巧都不好使了。

ContextFlow的解法

为了解决这些难题，ContextFlow提出了一个全新的框架，CV君觉得它的思路非常巧妙，主要有三大法宝。

法宝一：高阶求解器，保证无损逆向

首先，为了解决保真度问题，ContextFlow抛弃了传统的一阶求解器，改用了一个叫 Rectified Flow (RF) 的高阶求解器。你可以把它理解成一个更精确的“逆向工程”工具，它能把视频几乎无损地变成噪音，也能从噪音高质量地还原回来。这就打下了一个非常坚实的基础，保证了视频的背景和未编辑部分在整个过程中不会失真。