动态列表

成为「流量黑马」的老品牌，如何借拼多多秒懂 00 后？
AI 的终点不是对话框，这家公司想让真实世界成为 AI 的提示词
网易有道发布子曰教育大模型多款AI新品，定义教育AI应用能力L1-L5分级
二十余名英国青年科学家在沪参与好望角科学沙龙活动
为长视频生成减负！浙大与华为提出Compact Attention，挖掘结构化稀疏加速2.5倍
TPAMI 2025 | 骨架动作理解大一统：东南大学等提出USDRL，一个面向密集表征学习的基础模型
报名开启｜中关村国际青年论坛：诚邀全球青年学者共探AI前沿
Sora没做到的，LongVie框架给解决了，超长视频生成SOTA
「价格战」打了半年，吉利如何做到核心利润暴增102%？
小鹏Q2财报「炸裂」：营收暴涨125%，毛利率反超特斯拉
Nature子刊 | 上智院统一框架RXNGraphormer，实现化学反应多任务精准预测，自发掌握分类规律
首个面向肽分子设计的大模型平台：直接「读序列」出结合子，无需结构输入即可生成
智谱推出AutoGLM 2.0：手机 Agent 的「Manus 时刻」？
论坛报名已启动，速来锁定席位！解码具身智能的落地挑战与产业爆点
DiT在数学和形式上是错的？谢赛宁回应：不要在脑子里做科学
dLLM的「Free Lunch」！浙大&蚂蚁利用中间结果显著提升扩散语言模型
DeepSeek开源新基础模型，但不是V4，而是V3.1-Base
Meta超级智能实验室重组为四个部门，某些高管将离开
ICCV 2025 | 跨越视觉与语言边界，打开人机交互感知的新篇章：北大团队提出INP-CC模型重塑开放词汇HOI检测
黑神话系列第二作，《黑神话：钟馗》先导宣传片公布；小米卢伟冰：2027 年进军欧洲汽车市场；宇树预告新机器人
GPT-5暴写「屎山代码」！14个Prompt，看穿GPT-1到GPT-5七年智商进化史
微软最新揭秘：「话痨实习生」AI助手，到底能帮人类做什么？
陶哲轩「断粮」后，25年首次绝望怒吼：美国科学命脉被砍断！
16岁天才少年炒掉马斯克，空降华尔街巨头！9岁上大学，14岁进SpaceX
中科慧远发布CASIVIBOT，以九年积累开启AOI与机器人协同的品质检测新时代
英伟达ViPE：任意视频一键转为3D几何数据，开源引擎与亿级帧数据集重磅发布！
CVPR 2025 | DeCLIP：解耦CLIP注意力，哈工大（深圳）、港大提出通用开放词汇密集感知新框架
强化学习之父Richard Sutton最新演讲揭示OaK架构：通向超级智能的八步愿景
ICCV 2025 | RobustSplat: 解耦致密化与动态的抗瞬态3DGS三维重建
医疗AI安全革命：全球首个医疗动态红队测试框架DAS，破解临床落地信任危机
谷歌在上海办了场 AI 嘉年华，开发者们却说像逛「AI 基地」
7年了，OpenAI官方给出五代GPT对比，网友却怀念起「狂野」初代
X-SAM：从「分割一切」到「任意分割」：统一图像分割多模态大模型，在20+个图像分割数据集上均达SoTA
开源版Genie 3世界模型来了：实时+长时间交互，单卡可跑，国内公司出品
图生视频新玩法刷爆外网：图上画两笔就能动起来，终于告别文本提示
妙笔生维：线稿驱动的三维场景视频自由编辑
一句话，性能暴涨49%！马里兰MIT等力作：Prompt才是大模型终极武器
Z世代生存、学习与未来宣言！伯克利学霸预言课堂，用AI设计人生
AI来了！记者、UP主、写手，谁能逃过这场「灭绝浪潮」？
Hinton预言成真！AI接管美国一半白领，牛津哈佛扎堆转行做技工
为什么「游戏」是 AI 陪伴落地的好场景？
新加坡 AI 办公系统 Agnes：200 个 Agent 并行研究，让 AI 主动「找茬」打磨设计
机器人也会「摸鱼」了？宇树G1赛后葛优瘫刷美女视频，网友：比人还懂享受生活
从GPT-2到gpt-oss，深度详解OpenAI开放模型的进化之路
NextStep-1：一次在图像生成上自回归范式的探索
KDD 2025 | UoMo来了，首个无线网络流量预测模型，一个框架搞定三类任务
突破长视频生成瓶颈：南大 × TeleAI 联合推出全新 AI 生成范式 MMPL，让创意“一镜到底”
ICCV 2025 | MobileViCLIP：快55倍！南大等提出首个高效“视频-文本模型，让多模态AI在手机可运行！
开源扩散大模型首次跑赢自回归！上交大联手UCSD推出D2F，吞吐量达LLaMA3的2.5倍
一张图，开启四维时空：4DNeX让动态世界「活」起来
AI发现新物理定律：纠正等离子体理论多年错误假设
多模态大模型在化学与材料学的「体检表」——哪些能力靠谱，哪些还差很远？
Altman：希望 AGI 能提高生育率；与辉同行否认董宇辉年收入二三十亿元；今年国内智能眼镜市场同比增长121.1%
刚刚！谷歌内部揭秘Genie 3：Sora后最强AI爆款，开启世界模型新时代
硬核拆解！从GPT-2到gpt-oss，揭秘大模型进化关键密码
黄仁勋子女逆袭上位！4万亿「皇储」成长史首曝：一个学烘培，一个开酒吧
GPT-5首次会推理，OpenAI联创曝AGI秘诀！超临界学习吞噬算力，2045金钱无用？
400万人围观的分层推理模型，「分层架构」竟不起作用？性能提升另有隐情？
CoRL 2025｜隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力
SEAgent：开启从实战经验中自我进化的GUI智能体新纪元
给DiT装上“迷你”控制舵：NanoControl实现高效精准控制，参数量仅增0.024%
OpenAI估值达5000亿美元；「原道」联手小岛秀夫，推《死亡搁浅》耳机；苹果手表将「大幅重新设计」
奥特曼神秘晚宴讲话曝出！OpenAI的CEO或将是个AI，Chrome我也想买
谷歌最新「0.27B」Gemma 3开源！身板小却猛如虎，开发者直呼救命稻草
最惨就业季！CS学霸GPA 3.98，投2500份简历仅10次面试，AI吞噬入门级岗位
Yann LeCun最新纪录片首曝！传奇AI教父的双面人生，深度学习幕后40年
机器人全产业链接会 FAIR plus 2026新闻发布会在京召开
大模型如何推理？斯坦福CS25重要一课，DeepMind首席科学家主讲
当AI比我们更聪明：李飞飞和Hinton给出截然相反的生存指南
简单即强大：全新生成模型「离散分布网络DDN」是如何做到原理简单，性质独特？
ICCV 2025 | 告别“尬舞”，InterSyn交错式学习生成逼真多人交互动作
Sam Altman：AI存在泡沫；宇树机器人夺金，王兴兴：用遥控追求极致速度；蔡浩宇AI游戏上架，27.19元｜极客早知道
吞下17亿图片，Meta最强巨兽DINOv3开源！重新定义CV天花板
打开高德的理由又多一条！全球首个「需求链智能调度」AI地图上线
核心模型被曝蒸馏DeepSeek？前女友一纸控诉，曝出欧版OpenAI塌房真相！
一句话搞定多任务出行，高德用空间智能重新定义地图
GPT-5、Grok 4、o3 Pro都零分，史上最难AI评测基准换它了
谷歌开源Gemma 3 270M，性能超越Qwen 2.5同级模型
追剧不断网，可能背后有个AI在加班，故障诊断准度破91.79%
ICCV 2025 (Oral) | DPoser-X：基于扩散模型的鲁棒3D全身人体姿态先验，树立领域新标杆
DINOv3震撼发布：Meta AI的视觉巨兽，重新定义自监督学习
Meta视觉基座DINOv3王者归来：自监督首次全面超越弱监督，商用开源
多突触神经元模型问世，国内团队打造类脑计算新引擎，登上《自然·通讯》
Science封面：高效精准模拟构象变化，微软研究院用生成式AI重塑蛋白质功能研究
扎克伯格看OpenAI直播挖人，北大校友孙之清加入Meta
AI 模特时代到来：字节x清华推出商用级视频换装模型DreamVVT，保真度显著领先SOTA
LeetCode刷够100小时，学会找人内推，OpenAI员工下场教你拿Offer
xAI元老离职干风投，传奇人物Babuschkin长文追忆与马斯克创业战友情
链式思维是幻象吗？从数据分布视角重新审视大模型推理，马斯克回复，Grok破防
李想：i8 反响不错，产品力没对手；库克暗示：苹果将推桌面机器人；中国日均消耗 30 万亿 Token，暴涨 300 倍
ChatGPT会让大脑退化？OpenAI高管用它救下自己「读写障碍」的女儿
谷歌超级编码智能体正式上岗！125刀大会员，每天300任务任意跑
Meta华人天才毕树超「叛逃」预言：OpenAI未竟交互革命，暗藏万亿赛道
美国CS就业梦碎！狂投5000家0 Offer，名校毕业00后被麦当劳惨拒
3 分钟，我学会了像鸟儿一样飞行 | New Things
从隐私计算迈向六大数据流通全栈技术，“隐语”开源社区升级
7天，一场风暴！理想 i8「刮骨疗毒」，怒砍两个版本
小订过万！打死不说价格的全新小鹏 P7，用颜值吊起了所有人的胃口！
对话理想智驾负责人：撕掉「奶爸车」标签，智驶是理想的「新引擎」
告别「偏科生」时代！36 万的坦克500，让对手从此无路可走
万字长谈王小川：不再迎合他人做学霸，我要解自己的命题
刚刚，全网最懂图文调研的智能体模型震撼上线，看完我直接卸了浏览器
ICCV 2025 | HVPL：分层视觉提示学习，让“视频实例分割”模型告别灾难性遗忘
复旦&微软提出StableAvatar: 首个端到端“无限时长”音频驱动的人类视频生成新框架!
千支队伍争锋！首届「启智杯」算法大赛圆满落幕，助推AI应用落地
冗长响应缩减80%，DeepSeek GRPO获得颠覆性改进，微软GFPO问世
ICCV 2025 | HERMES：首个统一3D场景理解与生成的世界模型
苹果 AI 下半场：年底问世的新 Siri，要彻底改变 iPhone 的交互
GNN+KAN，把三角函数当「激活」选项，山大、南洋理工让分子图更会读化学子结构
港大联手月之暗面等开源OpenCUA：人人可造专属电脑智能体
破解「长程智能体」RL训练难题，腾讯提出RLVMR框架，让7B模型「思考」比肩GPT-4o
AI独角兽498家，估值2.7万亿美元；《王者荣耀》连续三年成全球最吸金手游；抖音测试「快递」服务｜极客早知道

DeepSeek-V3.1震撼发布，全球开源编程登顶！R1/V3首度合体，训练量暴增10倍

2025-08-21未知作者来源

新智元报道

编辑：桃子

【新智元导读】DeepSeek-V3.1官宣了，作为首款「混合推理」模型，将开启智能体新时代。新模型共有671B参数，编码实力碾压DeepSeek-R1、Claude 4 Opus，登顶编程开源第一。

官宣了！

刚刚，DeepSeek正式上线DeepSeek-V3.1，这是迈向智能体时代第一步。

新版V3.1采用了「混合推理」，一个模型，两种模型：思考与非思考（自主切换）。

相较于DeepSeek-R1-0528 ，DeepSeek-V3.1-Think推理速度更快。

最关键的是，V3.1具备了强大的智能体能力，不论是工具使用，还是多步骤任务，全部拿捏。

在软件工程基准测试中，DeepSeek-V3.1全方位碾压V3-0324和R1-0528。

在人类的最后考试HLE中，V3.1拿下了29.8高分，另外在数学、知识问答、编程等任务中，全面超越推理模型R1。

CoT压缩训练后，V3.1-Think在输出token减少了20%-50%，与R1-0528打成平手

在Hugging Face上，一共开源了两款V3.1 Base和V3.1，前者在V3基础上又进行了8400亿token的持续预训练，扩展了上下文支持。

项目地址：

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

https://huggingface.co/deepseek-ai/DeepSeek-V3.1

总的来说，DeepSeek-V3.1此次更新的最大亮点：

参数共671B，激活参数37B，上下文128k
混合推理模式：一个模型，即可同时支持推理模式和非推理模式。
更智能的工具调用能力：工具使用、智能体任务有了显著提升，多步推理能力强化，复杂搜索不在话下
更高的推理效率：回答质量上与DeepSeek-R1-0528相媲美，思考效率飙升，反应快如闪电
全面基准测试：实力全面碾压DeepSeek-R1-0528、DeepSeek-V3-0324

在API方面，deepseek-chat是非思考模式，deepseek-reasoner是思考模式，全部支持128k。

从9月5日开始，采用新的API定价

继OpenAI gpt-oss之后，DeepSeek终于做出了最强回应。

V3.1编程击败Claude 4，训练扩增10倍

HF模型卡中，给出了DeepSeek新模型技术的详细解读。

基于DeepSeek-V3.1-Base，DeepSeek-V3.1通过后训练优化完成。而V3.1-Base又是基于V3模型训练而来。

具体来说，它通过「两阶段长上下文扩展策略」构建，遵循了原始V3论文中的方法。

研究团队又扩展了数据集，收集了更多长文档，并大幅延长了两个训练阶段的规模。

32k扩展阶段增加了10倍，达6300亿Token，而128k扩展阶段增加了3.3倍，达到2090亿Token。

此外，DeepSeek-V3.1采用UE8M0 FP8缩放数据格式进行训练，确保与微尺度数据格式的兼容性。

在通用能力的基准测试中，开启思考模式V3.1，在MMLU、GPQA上拿下了亮眼的成绩。

数学方面，V3.1同样刷新SOTA，创下了最高分。

如上文所述，V3.1是迈向智能体时代第一步。它可以支持多种Code Agent框架，开发者可以自己搭建智能体。

在编码测试中，DeepSeek-V3.1-Thinking在Aider编码测试中，拿下了76.3%高分，远超Claude 4 Opus、Gemini 2.5 Pro（0325）。

在编码智能体测试中，DeepSeek-V3.1-Non Thinking性能碾压R1、V3。

此外，DeepSeek-V3.1可以支持Search Agent，在推理模式下可以使用。

当需要访问外部信息或最新信息的复杂问题，V3.1可以通过多轮工具调用流程，利用用户提供的搜索工具来完成。

基准测试中，尤其是BrowseComp上，V3.1实力粉碎了R1。

第三方Artificial Analysis基准，同样验证了DeepSeek-V3.1强大实力，仅次于gpt-oss。

在推理效率方面，V3.1也与OpenAI相当。

如今来看，DeepSeek-V3.1稳坐编程开源第一王座。

参考资料：

https://x.com/karminski3/status/1958429843558945015

https://x.com/deepseek_ai/status/1958417062008918312

<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652621707&amp;idx=1&amp;sn=7744095f98881cc866bbd15453e72d23&amp;chksm=f013760d1174b32619b5d3bc1f48ce91c5c373e15a0901603c852e3cc8683a1cdde88de4a35c&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/1uhvRyDLs5&amp;maxage=1y"  width="1px"></div></div></body></html>

动态列表

DeepSeek-V3.1震撼发布，全球开源编程登顶！R1/V3首度合体，训练量暴增10倍

新智元报道

【新智元导读】DeepSeek-V3.1官宣了，作为首款「混合推理」模型，将开启智能体新时代。新模型共有671B参数，编码实力碾压DeepSeek-R1、Claude 4 Opus，登顶编程开源第一。

类别

资源

联系我们