动态列表

刚刚！谷歌内部揭秘Genie 3：Sora后最强AI爆款，开启世界模型新时代
硬核拆解！从GPT-2到gpt-oss，揭秘大模型进化关键密码
黄仁勋子女逆袭上位！4万亿「皇储」成长史首曝：一个学烘培，一个开酒吧
GPT-5首次会推理，OpenAI联创曝AGI秘诀！超临界学习吞噬算力，2045金钱无用？
400万人围观的分层推理模型，「分层架构」竟不起作用？性能提升另有隐情？
CoRL 2025｜隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力
SEAgent：开启从实战经验中自我进化的GUI智能体新纪元
OpenAI估值达5000亿美元；「原道」联手小岛秀夫，推《死亡搁浅》耳机；苹果手表将「大幅重新设计」
奥特曼神秘晚宴讲话曝出！OpenAI的CEO或将是个AI，Chrome我也想买
谷歌最新「0.27B」Gemma 3开源！身板小却猛如虎，开发者直呼救命稻草
最惨就业季！CS学霸GPA 3.98，投2500份简历仅10次面试，AI吞噬入门级岗位
Yann LeCun最新纪录片首曝！传奇AI教父的双面人生，深度学习幕后40年
大模型如何推理？斯坦福CS25重要一课，DeepMind首席科学家主讲
当AI比我们更聪明：李飞飞和Hinton给出截然相反的生存指南
简单即强大：全新生成模型「离散分布网络DDN」是如何做到原理简单，性质独特？
Sam Altman：AI存在泡沫；宇树机器人夺金，王兴兴：用遥控追求极致速度；蔡浩宇AI游戏上架，27.19元｜极客早知道
吞下17亿图片，Meta最强巨兽DINOv3开源！重新定义CV天花板
打开高德的理由又多一条！全球首个「需求链智能调度」AI地图上线
一句话搞定多任务出行，高德用空间智能重新定义地图
GPT-5、Grok 4、o3 Pro都零分，史上最难AI评测基准换它了
谷歌开源Gemma 3 270M，性能超越Qwen 2.5同级模型
追剧不断网，可能背后有个AI在加班，故障诊断准度破91.79%
Meta视觉基座DINOv3王者归来：自监督首次全面超越弱监督，商用开源
多突触神经元模型问世，国内团队打造类脑计算新引擎，登上《自然·通讯》
Science封面：高效精准模拟构象变化，微软研究院用生成式AI重塑蛋白质功能研究
扎克伯格看OpenAI直播挖人，北大校友孙之清加入Meta
AI 模特时代到来：字节x清华推出商用级视频换装模型DreamVVT，保真度显著领先SOTA
LeetCode刷够100小时，学会找人内推，OpenAI员工下场教你拿Offer
xAI元老离职干风投，传奇人物Babuschkin长文追忆与马斯克创业战友情
链式思维是幻象吗？从数据分布视角重新审视大模型推理，马斯克回复，Grok破防
李想：i8 反响不错，产品力没对手；库克暗示：苹果将推桌面机器人；中国日均消耗 30 万亿 Token，暴涨 300 倍
ChatGPT会让大脑退化？OpenAI高管用它救下自己「读写障碍」的女儿
谷歌超级编码智能体正式上岗！125刀大会员，每天300任务任意跑
Meta华人天才毕树超「叛逃」预言：OpenAI未竟交互革命，暗藏万亿赛道
美国CS就业梦碎！狂投5000家0 Offer，名校毕业00后被麦当劳惨拒
3 分钟，我学会了像鸟儿一样飞行 | New Things
从隐私计算迈向六大数据流通全栈技术，“隐语”开源社区升级
7天，一场风暴！理想 i8「刮骨疗毒」，怒砍两个版本
小订过万！打死不说价格的全新小鹏 P7，用颜值吊起了所有人的胃口！
对话理想智驾负责人：撕掉「奶爸车」标签，智驶是理想的「新引擎」
告别「偏科生」时代！36 万的坦克500，让对手从此无路可走
万字长谈王小川：不再迎合他人做学霸，我要解自己的命题
刚刚，全网最懂图文调研的智能体模型震撼上线，看完我直接卸了浏览器
ICCV 2025 | HVPL：分层视觉提示学习，让“视频实例分割”模型告别灾难性遗忘
复旦&微软提出StableAvatar: 首个端到端“无限时长”音频驱动的人类视频生成新框架!
千支队伍争锋！首届「启智杯」算法大赛圆满落幕，助推AI应用落地
冗长响应缩减80%，DeepSeek GRPO获得颠覆性改进，微软GFPO问世
ICCV 2025 | HERMES：首个统一3D场景理解与生成的世界模型
苹果 AI 下半场：年底问世的新 Siri，要彻底改变 iPhone 的交互
GNN+KAN，把三角函数当「激活」选项，山大、南洋理工让分子图更会读化学子结构
港大联手月之暗面等开源OpenCUA：人人可造专属电脑智能体
破解「长程智能体」RL训练难题，腾讯提出RLVMR框架，让7B模型「思考」比肩GPT-4o
AI独角兽498家，估值2.7万亿美元；《王者荣耀》连续三年成全球最吸金手游；抖音测试「快递」服务｜极客早知道
奥特曼公然叫板马斯克！重金杀入脑机接口，硅谷两大巨头彻底决裂
AI女友24h陪玩，全球800万人上头！这群AI创企靠百度开挂
马斯克删除xAI「研究员」职位引爆网络！LeCun怒批：如此暴力将扼杀创新
OpenAI女CEO太狠了！智商148，GPT-5才是真印钞机
AI 和海外游戏发力，腾讯重回 7000 亿美金
博士申请 | 休斯敦大学计算机系刘锦阳老师招收高性能计算/数据压缩方向博士生
Kimi K2背后的冷门绝招：海量语料“重写”如何榨干每个token？
ICML 2025 | 奖励模型还用人标？APEC用对抗模仿生成偏好，泛化能力直线上升
Attention Sink的起源找到了？清华×美团首次锁定MoE中的「超级专家」
告别Transformer，重塑机器学习范式：上海交大首个「类人脑」大模型诞生
AI 上新｜在 Edge 浏览器里，我第一次感受到了 AI 的「人味」
Agent狂欢下的冷思考：为什么说Data&AI数据基础设施，才是AI时代Infra新范式
AI顶会模式出了问题？「不发表，就出局」的恶性循环，正在压垮整个AI学界
研究者警告：强化学习暗藏「策略悬崖」危机，AI对齐的根本性挑战浮现
多模态大脑建模技术迈入新纪元：Meta 10亿参数模型获Algonauts 2025大脑建模竞赛冠军
OpenAI没开源的gpt-oss基础模型，他去掉强化学习逆转出来了
当人们怀念 GPT-4o，他们在「怀念」什么？
IEEE TPAMI 南洋理工&哈工大提出 MARCONet++ 攻克中文文本图像超分难题
耶鲁&大连理工&南洋理工等提出MDCNeXt：X射线下的“动力电池缺陷精准检测”新范式
6秒造一个「视频博主」，Pika让一切图片开口说话
破解AI创企的「不可能三角」，解药不止「大模型」
OpenAI和奥特曼将投资一家脑机接口公司，直接与马斯克的Neuralink竞争
大型语言模型稳定强化学习的新路径：几何平均策略优化GMPO
传 DeepSeek-R2 8 月发布；微信测试信用借款功能；Perplexity 要 345 亿美元收购 Chrome
一觉醒来，GitHub没了？CEO辞职，微软接管，开发者天塌了
AI全国榜单爆冷，全网吃瓜大狂欢！这家黑马竟靠DeepSeek杀进全国TOP 2
物理学「AlphaGo时刻」？40年未竟之事被AI一举攻破，顶尖物理学家集体傻眼
刚刚，商汤内部两万字复盘曝光：多模态通往AGI核心路线首次公开
让强化学习快如闪电：FlashRL一条命令实现极速Rollout，已全部开源
从物竞天择到智能进化，首篇自进化智能体综述的ASI之路
破解效率与成本难题：华为UCM技术推动AI推理体验升级
SIGGRAPH上，英伟达发布物理AI开源新技术，更新RTX Pro产品线
身家25亿刀，是四家公司创始人，这位伯克利教授还在给本科生上课
商汤王晓刚：世界模型将加快AI从数字空间进入物理世界，「悟能」想做那个桥梁
北京内推 | 度小满金融视觉和多模态团队招聘视觉多模态算法实习生
实验室抢显卡抢破头？A800/H800骨折价来袭，超值返券助你轻松冲DDL！
后训练轻量「小枝」强势出击！极限剪裁视觉token，推理加速154%
ICCV 2025 | LightSwitch：CMU提出材质引导的扩散模型，2分钟实现高质量三维场景重打光
TCSVT 2025 | 跨模态学习助力复杂工业过程异常检测：FmFormer框架与基准测试新突破
AI全面挖掘微蛋白价值：首次引入合成负样本训练，剔除92%噪声，摆脱保守依赖
是「福尔摩斯」，也是「列文虎克」，智谱把OpenAI藏着掖着的视觉推理能力开源了
东方理工·甬江论坛｜新大学、新使命，邀你共启未来
LLM总是把简单任务复杂化，Karpathy无语：有些任务无需那么多思考
ICCV 2025 | 小红书AIGC团队提出图像和视频换脸新算法DynamicFace
聚焦前沿，见证未来!「X·创新』产品SHOW圆满举办!
刚刚，OpenAI拿下IOI金牌，仅次于前五名人类选手！参赛推理模型才夺得IMO金牌
Lumina-mGPT 2.0：自回归模型华丽复兴，媲美顶尖扩散模型
雷军：小米YU7改名，被误会是丐版；传淘宝闪购周末峰值超美团；低价 MacBook 或年底亮相，599 美元
OpenAI开源霸权5天终结，百川M2一战夺冠！实测比GPT更懂中国医疗
硅谷精英放弃生娃！MIT女记者揭秘：人类只是AI垫脚石，世界很快就毁灭
41个榜单SOTA！智谱最新开源GLM-4.5V实测：看图猜地址、视频秒变代码
2025全球大模型应用报告：红海混战「忠诚度」瓦解，用户脚踏4.7条船！
昆仑万维发布新模型 SkyReels-A3，开启五天技术发布周
世界机器人大会：笨拙的今天，与狂奔的明天
「一只手有几根手指」，你的GPT-5答对了吗？
4D空间智能：AI如何一步步「看懂」时空结构？一篇综述解析通往四维世界的五大层次
智谱终于发布GLM-4.5技术报告，从预训练到后训练，细节大公开
从捍卫者到引路人，上交&上海AI Lab提出LEGION：不仅是AI图像伪造克星，还能反哺生成模型进化？
ICCV 2025 | 机器人自主探索未知复杂空间？GLEAM破解主动探索建图的泛化难题
脑子比不过AI，手也要沦陷了？这只灵巧手看得我有点慌
第二届 “兴智杯” 全国人工智能创新应用大赛专题活动明天开启，技术解析 + 资源对接一站式平台重磅来袭！
机器人上下文协议首次开源：阿里达摩院一口气放出具身智能「三大件」
Attention Sink产生的起点？清华&美团首次揭秘MoE LLM中的超级专家机制
具身智能技术与应用论坛圆满举行，北京人形公布多项创新成果
ACL 2025 | 湖南大学、腾讯生命科学实验室等提出蛋白互作预测新方法，让LLM学会解读蛋白质网络
宇树、银河通用都在用：英伟达「物理AI」技术亮相世界机器人大会
CVPR 2025 | DPC：用于微调视觉-语言模型的双提示协作
ICCV 2025 | 终结灾难性遗忘！南大提出外部知识注入机制，刷新CLIP持续学习SOTA
超越样本级RL！人大×快手提出ARPO：熵驱动Agent探索，多轮推理性能飙升
北京/上海内推 | 盛大集团AI创新中心招聘大模型/Agent方向算法实习生
毒液抗菌搭配深度学习，千万级数据组中筛得386条备选，91.4%体外验证成功

核心模型被曝蒸馏DeepSeek？前女友一纸控诉，曝出欧版OpenAI塌房真相！

2025-08-15未知作者来源

新智元报道

编辑：Aeneas KingHZ

【新智元导读】曾被誉为「欧洲OpenAI」的Mistral AI，陷入「抄袭」丑闻！在分手小作文中，前员工爆料核心技术是蒸馏DeepSeek，却误导外界称为自主RL成果。

Mistal套壳DeepSeek，被当场抓现行了？

几天前就有人在X上爆料：Mistral的新模型是直接蒸馏自DeepSeek，而且基准测试结果还被歪曲了。

这个被视为欧洲版OpenAI「全村希望」的公司，地位就如同中国的DeepSeek一般，如今居然塌房了？

这实在是太魔幻了。

更为劲爆的是，这个重磅大瓜还是从一篇Mistral女员工的「分手小作文」里曝出来的。

原话是这样的——

你早知道Mistral做事不讲道德：把DeepSeek蒸馏后当成自己的模型，使用OpenAI的数据，对外却误导称是RL在发挥作用，但它实际上只是DS3的产物，还歪曲基准测试结果。

你不仅明知这些，还积极参与其中。当我指出这些问题时，你没有承担任何责任，反而选择无视我、对我冷处理。

情感纠纷小作文

曝出套壳大瓜

也就是说，这位Mistral离职的女员工，不仅在小作文中曝光了自己和前男友、Mistral同事的感情纠葛，还爆出Mistral套壳DeepSeek的丑闻。

这个消息一曝光，立马在全网引起了轩然大波。

DeepMind研究员Susan Zhang转发并评论，直接点名Mistral AI的不道德行为。

在「小作文」里，这位Mistral前员工痛诉自己如何接连遭遇上司排挤、伴侣出轨、求职无望，还要靠抗抑郁药物试图让情感生活重回正轨。

关键节点在2025年4月初， Mistral把她解雇了，原因在于工作分歧：

她明确反对通过蒸馏DeepSeek来误导用户。

这加剧了她对Mistral高层的不满——而她的伴侣又和高层关系密切。

在职业前途未卜、经济压力加剧、感情关系又充满不确定的三重打击下，她开始崩溃。

这让DeepMind研究科学家Andreas Kirsch非常同情。🙏

Mistral的「秘方」竟是DeepSeek，这一事实让人无语。

火眼金睛博主

早发现Mistral蒸馏DeepSeek

其实早在今年6月，就有一位火眼金睛的AI行内人发现，Mistral Small 3.2写的东西，它怎么这么像DeepSeek呢！

这位名为Sam Paech的行内人，同时还是EQ-Bench基准的维护者，可谓十分有眼光。

为了比较Mistral-small-3.2和DeepSeek-v3之间的相似性，这位博主在模型的创意写作输出中，提取了跟人类基线相比最过度呈现的单词和n-gram词组。

通过对这些词/n-gram中的前几百个数据特征进行层次聚类，生成了一张如下的相似性图。

肉眼可见，Mistral-small-3.2和DeepSeek-v3在谱系图中的位置非常接近，从而表明它们的特征是极其相似的。

这个过程中，他使用了一个生物信息学工具，基于slop特征谱的相似性，推断出了谱系树。

Susan Zhang对此直接表示，Mistral这身皮被扒下来，原来是DeepSeek啊！

甚至还有人发现，连Gemini Pro 2.5都和DeepSeek-R1之间有非常相似的感觉。

比如DeepSeek-R1非常擅长在对话中保持角色的一致性，而Gemini Pro 2.5也是如此，简直惊人的相似。

蒸馏不是错

HuggingFace联合创始人兼首席执行官表示，蒸馏开源模型有错吗？

毕竟，开源的意义之一就是让大家「自由使用」源代码，所以DeepSeek并不会禁止蒸馏。

而且蒸馏大模型也不简单，DeepSeek蒸馏自己的R1模型就不太成功。Paech本人也表示，其实蒸馏也不算什么大错，现在很多模型都是这么干的。

技术上，蒸馏是通过让小模型模仿大模型的输出结果来实现的。

大模型会把自己的「经验」（比如语言模式、写作风格）以一种简单的方式传给小模型。小模型通过大量练习，逐渐学会了类似的表现，但用更少的计算资源。

这种方法在AI领域很流行，因为这项技术很实用，比如能让大模型跑在手机或其他低性能设备上。

蒸馏本身不是错，编造谎言才是问题的实质！

说到头来，Mistral的问题不在于蒸馏DeepSeek，而在于把模型的进步归功于自家的RL方法，甚至蓄意改变基准测试。

没有清楚标注模型是蒸馏的，缺乏透明度，才是最关键的问题。

Mistral好像不止一次这么干，博士生Regi Kusumaatmadjia就发现Mistral的OCR功能与Mineru的OCR出奇的相似。

Mistral过去的高光时刻

想当初，Mistral可是深夜发一条磁力链接，就能让整个开源圈震撼的存在。

在今年2月，才成立一年多的Mistral AI已经估值62亿美金，成为法国的骄傲，欧洲的骄傲。

欧洲的开发者们一度欢呼：恭喜Mistral AI，让欧洲在AI竞赛中终于有了一席之地。

Mistral AI的超级应用助手Le Chat，还一度登顶法国免费APP的榜首。

马克龙一直以来也积极支持Mistral，称其为：「法国人工智能产业的皇冠上瑰宝」。

2023年，这三位来自谷歌DeepMind、Meta的前员工希望打造一家遵循欧洲模式的AI公司——开源、高效、注重隐私。

随后，他们就用自己的方式，颠覆了硅谷的传统。

在当时，当OpenAI斥资超1亿美金训练GPT-4时，Mistral仅用2200万美元就打造出了最具竞争力的AI模型。

甚至马克龙还信誓旦旦表示，法国未来几年将投资1090亿欧元用于建设AI，尽最大努力为包括Mistral在内的公司创造空间。

在成立仅仅七个月的时间里，Mistral就在两个主要「权重级别」上发布了SOTA开源大语言模型（mistral-7b 和 mixtral）。

Mistral在底层架构持续取得突破（如sparse mixture-of-experts，稀疏专家混合架构）。

这对一家初创公司而言，成就非凡。

刚刚，他们还推出了Mistral Medium 3.1，表示整体性能提升巨大。

不过，这次推文底下质疑声不断。

谁都没想到，当初承载了多少人希望的Mistral，如今竟发展到了这一步。

参考资料：

https://x.com/ns123abc/status/1955044877110071480

https://x.com/gmmvg/status/1955002717698658719

https://x.com/paulopacitti/status/1955003793927524717

<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652620480&amp;idx=1&amp;sn=d83c52b718f22fd3dcfd1bb6a889f1b0&amp;chksm=f0a688a204f5968689a5e5c93544443d3e04913562a380cdf7e2b99a960b21a1a9821d5a9914&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/83671/HVrSq3zoKB&amp;maxage=1y"  width="1px"></div></div></body></html>

动态列表

核心模型被曝蒸馏DeepSeek？前女友一纸控诉，曝出欧版OpenAI塌房真相！

新智元报道

【新智元导读】曾被誉为「欧洲OpenAI」的Mistral AI，陷入「抄袭」丑闻！在分手小作文中，前员工爆料核心技术是蒸馏DeepSeek，却误导外界称为自主RL成果。

类别

资源

联系我们