趋势追踪

聚焦AI最新技术应用、行业资讯、投资风向及创新动态,为您提供全面的市场洞察

AI 最新动态

港中文&港科大等提出FullPart:让3D部件生成达到全分辨率精度

港中文&港科大等提出FullPart:让3D部件生成达到全分辨率精度

CV君 2025 11 01 12 12 江苏 破解小部件分辨率低的难题 最近 3D内容生成领域又迎来了一项令人瞩目的进展 来自香港中文大学 香港科技大学 商汤研究院和重庆大学的研究者们联手提出了一种...

# 详细内容
从 「会思考」到 「善创造」: 多模态大模型的深度推理与协同进化

从 「会思考」到 「善创造」: 多模态大模型的深度推理与协同进化

52CV 2025 11 01 12 12 江苏 研究显示动态决策比静态监督更关键多模态大模型 MLLMs 的浪潮席卷而来 在基础感知 理解和生成等任务上的表现令人惊叹 然而 使MLLMs从简单的感知...

# 详细内容
谢菲尔德大学提出Region-CAM:mIoU提升13.6%,破解弱监督学习中的目标定位难题

谢菲尔德大学提出Region-CAM:mIoU提升13.6%,破解弱监督学习中的目标定位难题

CV君 2025 10 31 16 38 江苏 显著提升弱监督学习中目标区域的覆盖度和边界准确性 今天想跟大家聊一篇非常有意思的文章 来自谢菲尔德大学的研究者们提出了一种新的激活图生成方法 Regio...

# 详细内容
港科大(广州)等联合发布多模态空间推理综述:为大模型画下空间理解的未来蓝图

港科大(广州)等联合发布多模态空间推理综述:为大模型画下空间理解的未来蓝图

CV君 2025 10 31 16 38 江苏 一篇全面的综述 系统梳理了大模型时代多模态空间推理的现状 挑战与未来 我们生活在一个三维的世界里 理解空间关系是与生俱来的本能 但是 对于近年来飞速发展...

# 详细内容
ReDiff:突破并行生成瓶颈,多模态扩散模型生成质量与效率双提升

ReDiff:突破并行生成瓶颈,多模态扩散模型生成质量与效率双提升

52CV 2025 10 31 16 38 江苏 论文标题 From Denoising to Refining A Corrective Framework for Vision Language ...

# 详细内容
英伟达开源ChronoEdit,让P图学会物理常识,时序推理颠覆图像编辑!

英伟达开源ChronoEdit,让P图学会物理常识,时序推理颠覆图像编辑!

CV君 2025 10 31 16 38 江苏 AI编辑学会 脑补 P图从此遵循基本法 最近 AI图像编辑技术层出不穷 但大家可能也发现了 很多模型生成的图片虽然乍一看很惊艳 但仔细一琢磨 总觉得哪里...

# 详细内容
天津大学与快手联手提出GRAG:仅需4行代码,实现图像编辑的“丝滑”微调

天津大学与快手联手提出GRAG:仅需4行代码,实现图像编辑的“丝滑”微调

CV君 2025 10 30 08 33 江苏 无需调参 让你的AIP图效果丝滑可控 最近 基于Transformer的扩散模型 DiT 在图像编辑领域可以说是风生水起 但大家在享受AI带来便利的同时...

# 详细内容
普林斯顿大学联手谷歌DeepMind,BOB让少样本细粒度分类精度飙升7.4%

普林斯顿大学联手谷歌DeepMind,BOB让少样本细粒度分类精度飙升7.4%

CV君 2025 10 29 13 08 江苏 少样本学习新范式 解耦并边缘化上下文 让合成数据超越真实样本 最近 来自普林斯顿大学和谷歌DeepMind的研究团队联手 为我们带来了一项非常有趣的研究...

# 详细内容
IROS 2025 | 大连理工等提出STG-Avatar:25分钟训练,单目视频实时生成高保真数字人

IROS 2025 | 大连理工等提出STG-Avatar:25分钟训练,单目视频实时生成高保真数字人

CV君 2025 10 29 13 08 江苏 单目视频生成实时高保真数字人最近 数字人领域因为3D高斯溅射 3D Gaussian Splatting 技术的出现 又热闹了起来 这项技术大大加快了渲...

# 详细内容

AI 应用案例

美国大学排名出炉:哥大断崖式下滑,MIT稳居CS榜第一!

美国大学排名出炉:哥大断崖式下滑,MIT稳居CS榜第一!

新智元报道 倾倾 新智元导读 就在刚刚 2026 U.S. News美国大学排名出炉 哥大从第2跌到第15 伯克利公立逆袭 榜单格局重写 2....

# 详细内容
开源即登榜!登顶全球前十AI编程智能体,UCL初创团队开源Prometheus

开源即登榜!登顶全球前十AI编程智能体,UCL初创团队开源Prometheus

新智元报道 来自伦敦大学学院 UCL 的初创团队EuniAI开源发布了AI软件智能体Prometheus 该系统在SWE bench Verified上取得71....

# 详细内容
奥特曼考虑给ChatGPT加广告了!用8亿用户,救万亿债务

奥特曼考虑给ChatGPT加广告了!用8亿用户,救万亿债务

新智元报道 自从ChatGPT问世以来 OpenAI已成为全球瞩目的AI明星公司 短短两年多时间里 ChatGPT的周活跃用户就攀升至8亿之巨 如此庞大的用户基础帮助OpenAI迅速达到预计约130亿...

# 详细内容
VaseVQA:考古领域实现专家级,诊断+补弱RL框架

VaseVQA:考古领域实现专家级,诊断+补弱RL框架

新智元报道 古希腊陶器是考古学和艺术史的重要实物证据 研究者需要从单件陶器中提取多层信息 材质与工艺 形制类别 装饰主题 出土地与时间 甚至可能的作坊或画师 ...

# 详细内容
弑母分尸案震惊世界,AI伪造语音骗过警察!

弑母分尸案震惊世界,AI伪造语音骗过警察!

新智元报道 10月6日 Martha的家人收到了她的语音 那是一个普通的下午 她的声音一如既往 温柔 克制 还夹着一点催促的口气 别担心 我晚上回来 而十天后 警方在却在洗衣机里找到了她的尸体 她的女...

# 详细内容
AI黑化如恶魔附体!LARGO攻心三步,潜意识种子瞬间开花 | NeurIPS 2025

AI黑化如恶魔附体!LARGO攻心三步,潜意识种子瞬间开花 | NeurIPS 2025

新智元报道 你的AI助手真的安全吗 你敢信吗 只要在AI的 脑子 里注入一段精心 调制 的 想法 就能让它自己 黑化 说出本不该说的秘密 比如 AI设计一封获取用户密码的钓鱼邮件 创建散布不实信息的虚...

# 详细内容
可攻可防,越狱成功率近90%!六大主流模型全中招 | EMNLP'25

可攻可防,越狱成功率近90%!六大主流模型全中招 | EMNLP'25

新智元报道 大型语言模型 LLMs 在信息处理 内容生成等领域应用广泛 如LLaMA DeepSeek ChatGPT 但随着其与现实场景深度融合 安全问题愈发凸显 可能被用于传播网络犯罪指令 虚假信...

# 详细内容
硅谷的「十万大裁员」:Meta按代码量裁员

硅谷的「十万大裁员」:Meta按代码量裁员

新智元报道 一个阴郁的清晨 在旧金山Salesforce公园的亲子歌谣活动上 一位年轻的父亲 同时也是一名软件工程师 推着婴儿车若有所思 几天前 他刚收到Salesforce的裁员通知 成为这家市值2...

# 详细内容
超94%类别第一!3D点云异常检测与修复新SOTA | ICCV'25

超94%类别第一!3D点云异常检测与修复新SOTA | ICCV'25

新智元报道 在制造质检 机器人抓取与3D打印等场景中 3D点云的异常检测日益关键 但实际应用却常遭遇两大难题 一是物体姿态随机 形变细微 传统离散化表示 体素 点云 视角投影 容易丢失几何细节 二是检...

# 详细内容

AI 学习资源

北京/上海/杭州内推 | 蚂蚁集团保险大模型算法团队招聘大模型算法专家(P6-P7)

北京/上海/杭州内推 | 蚂蚁集团保险大模型算法团队招聘大模型算法专家(P6-P7)

帮你找工作的 2025 10 27 18 34 北京 合适的工作难找 最新的招聘信息也不知道 AI 求职为大家精选人工智能领域最新鲜的招聘信息 助你先人一步投递 快人一步入职 ...

# 详细内容
RL记得更牢,SFT更健忘?普林斯顿陈丹琦团队改写后训练认知

RL记得更牢,SFT更健忘?普林斯顿陈丹琦团队改写后训练认知

原创 让你更懂AI的 2025 10 27 18 34 北京 模型能否记得更牢 不取决于算法聪不聪明 而在于它学的是 谁的数据 同样的后训练 RL 让模型更稳 SFT 却更健忘 普林斯顿陈丹琦团队发现...

# 详细内容
多人物也能“认得准”!阿里开源Identity-GRPO,刷新视频生成一致性上限

多人物也能“认得准”!阿里开源Identity-GRPO,刷新视频生成一致性上限

让你更懂AI的 2025 10 27 18 34 北京 让模型不再 认错人 在视频生成的世界里 认不清人 成了一个尴尬的通病 无论是两个人同框跳舞 还是多人合作演绎剧情 模型常常为了追求画面一致性而牺...

# 详细内容
博士申请 | 香港中文大学陈玥老师招收人工智能/智能电网方向全奖博士生

博士申请 | 香港中文大学陈玥老师招收人工智能/智能电网方向全奖博士生

帮你找学校的 2025 10 26 20 05 北京 合适的工作难找 最新的招聘信息也不知道 AI 求职为大家精选人工智能领域最新鲜的招聘信息 助你先人一步投递 快人一步入职 ...

# 详细内容
思而不学则殆:通义实验室×北大联合提出RL-PLUS,突破大模型推理边界

思而不学则殆:通义实验室×北大联合提出RL-PLUS,突破大模型推理边界

原创 董益宏 2025 10 26 20 05 北京 学思合一 重塑推理边界 学而不思则罔 思而不学则殆 仅依赖 GRPO 类探索 会导致大模型出现能力塌缩 RL PLUS 创新性地融合监督学习 学 ...

# 详细内容
NeurIPS 2025 | 理解能否反过来教生成?VideoREPA让视频生成模型“懂物理”

NeurIPS 2025 | 理解能否反过来教生成?VideoREPA让视频生成模型“懂物理”

原创 让你更懂AI的 2025 10 26 20 05 北京 我们用视频生成模型画出世界 但是真的理解世界吗 当前的视频生成模型看似能生成逼真场景 但实际上并不理解物理世界 物体会悬空不落 流体会违背...

# 详细内容
北京内推 | 腾讯混元大模型团队招聘多模态大模型DeepResearch方向算法实习生

北京内推 | 腾讯混元大模型团队招聘多模态大模型DeepResearch方向算法实习生

帮你找工作的 2025 10 24 17 37 北京 合适的工作难找 最新的招聘信息也不知道 AI 求职为大家精选人工智能领域最新鲜的招聘信息 助你先人一步投递 快人一步入职 腾讯混元大模型是腾讯公司...

# 详细内容
会看图≠会画图:SRUM用理解教会生成,探索统一多模态自我进化之路

会看图≠会画图:SRUM用理解教会生成,探索统一多模态自我进化之路

原创 让你更懂AI的 2025 10 24 17 37 北京 理解与生成的边界 正被SRUM一点点打破TLDRSRUM 是一种简洁高效的后训练方法 其核心动机在于 当前统一多模态模型的理解能力普遍优于...

# 详细内容
GPT-5当上论文作者!AI首次以正式身份参与数学证明,攻克Erdős悬赏猜想

GPT-5当上论文作者!AI首次以正式身份参与数学证明,攻克Erdős悬赏猜想

原创 让你更懂AI的 2025 10 24 17 37 北京 6000行代码 让GPT 5成为数学史上首位 署名作者 半个世纪悬而未解的数学谜题被攻克 而这次写下证明的 不只是人类 GPT 5 被正式...

# 详细内容

联系我们