动态列表

  • 万亿参数狂欢!一文刷爆2025年七大顶流大模型架构
  • 豪拒15亿美金天价Offer,硅谷最狂AI巨星身份曝光!小扎、奥特曼抢破头
  • 兔子蹦迪疯传,5亿观看!全球恐慌:一段AI视频把全人类拉入虚拟现场
  • 全网苦等GPT-5,超级对齐团队遗作成重要线索,奥特曼发话「惊喜很多」
  • 图灵奖得主Sutton再突破:强化学习在控制问题上媲美深度强化学习?
  • GUI定位还在玩「非黑即白」?浙大团队提出GUI-G²,显著提升GUI智能体定位性能
  • OpenAI IMO金牌团队爆料:AI拒绝作答第六题
  • ​特斯拉车祸,被判赔偿超 2 亿美元;传 OpenAI 将推 10 美元「亲民订阅」;影石刘靖康:祝贺同行大疆推全景相机
  • GPT-5难产内幕曝光!核心团队遭挖空,推理魔咒难破,靠英伟达续命
  • 哥大学生全员AI作弊?小哥「创业逆袭」:不用AI等于输在起跑线!
  • Hinton预言成真,美国大学生掀起本科辍学潮!月入万刀修马桶,不怕AI裁员
  • 天才美少女的开挂人生,首次揭晓!11岁自学微积分,17岁推翻40年难题
  • GPT-5难产,外媒爆料:性能提升不大,OpenAI高管Slack上当众破防
  • 19岁小哥伯克利辍学创业,获2800万美元融资,OpenAI投了
  • 通向L3的正确范式?理想i8全球首发VLA高阶辅助驾驶,我们帮你试了试
  • ICCV 2025 | EPD-Solver:西湖大学发布并行加速扩散采样算法
  • 刚刚,谷歌「IMO金牌」模型上线Gemini,数学家第一时间证明猜想
  • 一个模型超了DeepSeek R1、V3,参数671B,成本不到350万美元
  • 多模态后训练反常识:长思维链SFT和RL的协同困境
  • 库克打气苹果 AI:不拼首创,自信能主导市场;微信提现手续费下调至 0.01 元;Manus 推 Wide Research
  • 微软破4万亿,被裁员工扎心!70级工程师天价薪酬曝光:入职大礼包2700万
  • 港科大发布「大模型越狱攻击」评估基准,覆盖37种、6大类别方法
  • 刚刚,OpenAI神秘开源模型泄露!「闪现」1分钟被删,配置被网友扒光
  • 24岁辍学博士,小扎捧2.5亿薪酬包亲自上门抢人!AI顶薪已让NBA汗颜
  • 奕派科技重磅发布“未来之翼”战略,2026款东风奕派eπ008限时先享价17.36万元
  • 一切竞争,都变成了「AI 竞争」
  • 途深智合推出旗下AI科研品牌--追梦AI
  • 模型共享、数据互通、设施互连,上海人工智能实验室上线「书生」科学发现平台
  • 一次中稿10篇ACL25,通义实验室 代码智能&对话智能团队 在研究什么
  • 联合三大蛋白质模型,仅需4~6周,定制癌细胞特效「识别器」
  • 全球首款通用AI科研智能体问世:我一个文科生用它写了份CRISPR基因编辑综述报告
  • 中国在AI领域超越美国已是板上钉钉?吴恩达:美国无法保持领先
  • 驯服复杂表格:九天重磅开源,开启「人与表格对话」智能新时代
  • 思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型
  • 超聚变亮相WAIC 2025 重构数智化平台,共建智能体时代
  • Manus大升级,100多个智能体并发给你做任务
  • 挖人上瘾的Meta又被员工吐嘈:不帮忙宣传项目,开源只会越来越糟
  • 机器人不只会抓和放!北京大学X银河通用「世界-动作模型」赋能全面泛化的非抓握技能
  • 火山引擎作为「AI 原生」基础设施,变得更强了
  • 英伟达回应「芯片后门」:不存在后门;大疆推 Osmo 360 全景相机,2999元;微软成第二家 4 万亿美元公司
  • WAIC唯一指定C位,AI「国家队」又赢麻了!秒懂Hinton伦敦腔,现场杀疯老外狂点赞
  • 首部法律LLM全景综述发布!双重视角分类法、技术进展与伦理治理
  • 小扎一夜反水,背刺开源!亲手葬送「Llama神话」,股价大涨12%
  • GPT-5发布倒计时?全网泄露来了:微软Copilot憋大招,GPT-5上线最后冲刺!
  • 17.98 万的乐道 L90,有多少蔚来的诚意,就有多少李斌的「求生欲」
  • ACL'25最佳论文独家解读:大模型有「抗改造」基因,现有后训练范式失灵预警
  • 当提示词优化器学会进化,竟能胜过强化学习
  • ACL 2025主会论文 | TRIDENT:基于三维多样化红队数据合成的LLM安全增强方法
  • 谷歌发布AlphaEarth基础模型:构建「地球版ChatGPT」,融合多源数据,实现10米级地球观测
  • 微软花重金做的Copilot,居然被WPS一个按钮给秒了?
  • 定义科学智能2.0:在WAIC,复旦与上智院的答案是开放协作、科学家为中心,以及一个「合作伙伴」
  • OpenAI提出的CLIP,被Meta联合谢赛宁、刘壮,扩展到全球300+语言
  • VLA-OS:NUS邵林团队探究机器人VLA做任务推理的秘密
  • XREAL One Pro 体验:AR 老炮的自我革命
  • WAIC UP! 之夜:一场关于AI与人类未来的星空思辨
  • AI 智能体,让每个人可以像科学家一样工作和思考
  • 刚刚,扎克伯格公开信:Meta不会开源全部模型
  • 没敲过代码的我,半小时「聊」出一个能用能分享的「小程序」
  • 把指纹焊死在频率上:抗微调神经网络指纹的硬核方案来了
  • 32.18万起!理想i8正面「硬刚」特斯拉Model X
  • 智能驾驶最大的障碍,不是懂车帝
  • 刚刚,DeepSeek梁文锋NSA论文、北大杨耀东团队摘得ACL 2025最佳论文
  • 小米青年公寓正式启用,1999 元/月;Meta AI 数据中心投入 720 亿美元;NBA 引入「AI 篮球」
  • AI百人榜刷屏,小扎照单全收?辛顿Ilya师徒霸榜,第二名竟是本科生
  • 炮轰黄仁勋,决裂奥特曼!1700亿美元估值背后,硅谷最不好惹的AI狂人
  • 别只盯着李飞飞!AI的「3D数据底座」已被这家中国公司悄悄建好
  • 无需准确传感信号!轻松搞定「多段软体机械臂」复杂位姿与形状控制
  • Nature 子刊 | DeepSeek落户超750家医院,清华团队剖析AI医疗监管隐忧
  • P图手残党有救了,豆包·图像编辑模型3.0上线,一个对话框搞定「增删改替」
  • 开出10亿美元天价,小扎挖人Mira创业公司惨遭拒:俺们不差钱
  • 当智能成为主要生产资料,硅基经济学引爆「AI+金融」
  • SPIRAL:零和游戏自对弈成为语言模型推理训练的「免费午餐」
  • 刚刚,OpenAI推出学习模式,AI教师真来了,系统提示词已泄露
  • 凌晨,Qwen又更新了,3090就能跑,3B激活媲美GPT-4o
  • AI安全上,开源仍胜闭源,Meta、UCB防御LLM提示词注入攻击
  • 字节辟谣「豆包汽车」:无造车计划;英伟达市值突破4.3 万亿美元;传特斯拉将推「低价赛博皮卡」
  • 科学能力太强,这个多模态推理「六边形战士」被严重低估!Intern-S1开源登顶
  • 全球首次,「AI记忆」开源落地!MIRIX同步上线APP
  • GPT-5基准测试泄露,被曝两天后发布?打Minecraft震撼开挂网友直呼封神
  • 马斯克偷偷憋了个大招!Grok秒出《阿凡达》画质,好莱坞瑟瑟发抖?
  • 理想i8正式发布:首款纯电SUV,售价32.18万元起
  • WAIC 2025大黑马,一个「谢耳朵AI」如何用分子式超越Grok-4
  • 通义实验室大火的 WebAgent 续作:全开源模型方案超过GPT4.1 , 收获开源SOTA
  • 这家国内公司,在给具身智能技术栈做「通解」
  • ACL首届博士论文奖公布,华人学者李曼玲获荣誉提名
  • 全球首个全链式空间天气AI预报模型“风宇”!国家卫星气象中心牵头,联合南昌大学、华为共同研发
  • LeCun出手,造出视频世界模型,挑战英伟达COSMOS
  • 联合十余家国产生态,商汤大装置发布“算力Mall”,打造算力超级市场
  • 用说的就能做 App,这家公司想做 AI 时代的 ins
  • 从数字人到「有温度的」机器人,京东把 AI 深度应用的路线图「摸透」了
  • 开启RL Scaling新纪元,siiRL开源:完全分布式强化学习框架,支持超千卡规模高效训练
  • 共青年之智,铸AGI未来|2025 WAIC云帆奖得主名单揭晓
  • 阿里再开源,全球首个MoE视频生成模型登场,电影级美学效果一触即达
  • 不靠海量数据,如何精准喂养大模型?上交Data Whisperer:免训练数据选择法,10%数据逼近全量效果
  • WAIC2025,斑马智行元神AI获国际测评机构全项第一
  • 蛋白质基座的GPT时代来了?AMix用Test-time Scaling让蛋白质设计迈向通用智能
  • Allegro-FM:剑指分子动力学基础模型,零样本预测89种元素及复杂反应
  • AI 上新|不会用 PS 的我,却敢去小红书上接「设计单」了
  • GMI Cloud 于 WAIC 2025 展现全栈 AI 基建实力,破解出海成本与效率难题
  • WAIC 2025: 斑马智行元神AI大模型,获全球机构测评第一
  • 国内首例!由钉钉AI平台训练的豆蔻大模型通过妇产科主任医师考试
  • 闭幕式 | 2025世界人工智能大会暨人工智能全球治理高级别会议成功举办
  • 智谱发布新一代基座模型GLM-4.5:开源、高效、低价,专为智能体而生
  • AI Agents的“超级大脑”来了 阿里云正式发布无影Agentbay
  • WAIC 2025前探:AI硬件如何改变我们的日常生活
  • 这届WAIC,无问芯穹发布了三个「盒子」
  • 「幻觉」竟是Karpathy十年前命名的?这个AI圈起名大师带火了多少概念?
  • EvaLearn:AI下半场的全新评测范式!
  • 蚂蚁数科发布金融推理大模型 助力金融机构加速落地智能体应用
  • 2025 WAIC容联云AI AGENT论坛启幕,以技术引擎驱动产业智能跃迁
  • 商汤大装置亮相WAIC 2025,多项标志性成果打造AI基础设施新范式
  • 广大、清华等开发EdgeAIGC,让边缘缓存命中率飙升41%,AIGC延迟与成本双降
  • WAIC直击|快手可灵AI引领「生成式AI应用元年」,累计生成超2亿视频
  • 硬核「吵」了30分钟:这场大模型圆桌,把AI行业的分歧说透了
  • ICCV 2025|UV-CoT:无监督视觉推理新突破,偏好优化重塑图像级思维链
  • 扣子开源全家桶,Apache 2.0加持,AI Agent又一次卷到起飞
  • 多模态大模型,真的「懂」世界吗?——揭秘 MLLM 的核心知识缺陷
  • 具身智能,腾讯「低调入局」
  • 首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练
  • 特斯拉廉价 Model Y 减配内饰曝光;Firefox 终止中国账户运营;宇树王兴兴:经常偷懒,用 AI 写代码|极客早知道

九天大模型大变身:性能狂飙35%!还能一键P大象



  新智元报道  

编辑:KingHZ 桃子
【新智元导读】九天基础大模型3.0震撼发布!在2025世界人工智能大会上,九天基础大模型端到端技术全面升级,性能飙升35%,智能体调用效率提升21%,15T token预训练,还是全国产!

7月26日,在2025世界人工智能大会期间,中国移动焕新发布「九天」基础大模型3.0。

本次发布的「九天」基础大模型3.0,重点聚焦模型的端到端技术升级以及生成可控性能力的增强,进一步强化九天大模型「高安全、高可控、全国产、全行业」的独特优势。


端到端升级,九天众擎性能大跃升


九天众擎语言大模型1.0于2023年10月发布,实现了大模型数据构建、预训练、微调、推理等全链路核心技术自主研发,是首个通过国家网信办双备案的央企大模型。

九天众擎语言大模型2.0于2024年7月发布,创新提出基于稀疏专家混合语言架构,模型参数及训练数据均有飞跃性提升,预训练阶段采用了5万亿Token数据,此外,还引入了10%的行业知识数据。

本次发布的语言大模型3.0在架构、数据、后训练、算力适配等方面实现了升级和技术创新。

架构方面,突破性采用业界领先的MoE(Mixture of Experts)架构,通过并行优化、混精计算优化、权重去冗余优化、构建自动故障恢复程序、框架快速编译与编译缓存、全局集合通信域异步创建及算子通信预建链等技术创新,解决了大模型解决算法精度溢出、非确定性计算误差、检查点存储慢、稀疏模型训练效率低下等问题。

数据方面,预训练数据总规模扩增到15T token,采用了多阶段配比方式:在第一阶段学习海量知识,第二阶段用高质量数据重点提升数学推理等各种专项能力,第三阶段(退火阶段)用长文数据和更高质量数据进行能力上的进一步爬坡。

在高质量数据方面,对数学、逻辑推理、代码、专业知识等重点领域进行了大幅增强,在数据上实现了简洁回答与长思维链深度思考的有机结合。

此外,还构建了覆盖全流程的数据治理体系技术架构,涵盖多源异构语料采集、深度清洗与标注等关键环节,还集成了敏感度检测、动态资源调度等核心能力,能够实现多语言、多文化、多地域表达的高质量覆盖,特别是在复杂语境与稀缺资源条件下具备显著优势。

后训练方面,在数据筛选阶段,核心创新在于构建了包含113域×53能力的「二维分级」数据体系,并系统性应用了基于「质量/难度/多样性/必要性」的四维筛选准则;

在数据合成阶段,创新性地提出层级原则体系, 实现从安全到高级文风再到模型个性的多维度精准指导,同时设计了数据驱动原则归纳方法及动态应用机制,从高质量数据中自动提炼隐形规则,助力九天模型从机械式检索进化为能输出商业洞察与情感共鸣的智能助手;

在强化学习阶段, 设计了一种多阶段的强化学习训练方法,创新性地结合了动态温度调节、难度自适应的数据更新机制以及上下文窗口逐步扩展策略, 实现了在长期训练过程中的稳定性保障与模型能力的持续提升。

算力适配方面,九天众擎语言大模型3.0实现了在算子、框架、模型三个层面的全栈国产适配,实现了与11家芯片厂商17款国产AI芯片的适配,在研发期间共解决了200+个芯片硬件、集群、算子、算法框架中的缺陷,完成60项算子和训练算法方面的优化。

通过多维度的端到端技术升级,模型的复杂推理能力较上一代提升35%,智能体调用效率提升21%,实现了性能的跨越式进步。

在IFEval评测中,「九天」以88.61分超越其他模型,在MMLU-Pro测评中,以71.41分超越Qwen3,在ArenaHard V0.1测评中,以91.4分超越DeepSeek V3。

性能跃升的同时,九天众擎语言大模型以「高可控智能体」为核心,构建了覆盖知识问答、角色服务、流程控制的全链路解决方案。在知识问答层面,具有低幻觉文档问答能力,通过深度语义解析精准捕捉用户意图,依托真实文档实现有据回复,确保信息生成的真实性与可靠性。

角色扮演服务场景中,模型聚焦沉浸式角色演绎,深度解析角色背景信息与SOP服务流程,基于深度推理能力模拟角色思考逻辑,显著提升客户交互的真实感与专业度。

在业务流程控制环节,九天众擎语言大模型支持自然语言、伪代码、Mermaid等多种方式描述业务规范流程,严格遵守既定工作流程与API接口协作规则,灵活应对多嵌套、多分支的复杂任务,有效规避「规划幻觉」风险,保障业务流程执行的确定性与可控性。

基于最新的语言大模型,中国移动此次也推出多个专项大模型。九天代码大模型使用两阶段的持续训练技术,支持代码生成、注释生成、单元测试生成、代码智能问答等多种任务,支持Python、Java、JS、TS、Go、C++等10+种主流编程语言。

性能方面,在LivecodeBench v5、BFCL V3等代码生成榜单成绩超越Qwen3及DeepSeek V3。

九天代码大模型可快速实现HTML页面设计:

九天数学大模型,在短思考、长思考模式均达到业界SOTA水平,在MATH500及AIME 2024测评任务中指标超越Qwen3。

九天大模型数学推理方面表现出色,能够准确理解数学问题的核心逻辑,并运用多种方法进行推理和验证,精准地给出答案。

本题推导了Shor算法进行质因数分解时,量子傅里叶变换后的量子态坍缩概率分布公式,模型基于周期性态和量子傅里叶变换的数学性质计算测量结果的概率


高可控视觉生成,九天善智多模态能力焕新


九天善智多模态大模型全面提升生成可控性,基于复杂时空建模、流匹配图片视频渐进式联合训练、端到端局部可控注意力机制等创新,同时引入多模态理解信息提升对文本指令和输入条件图像视频的感知能力,联合图文交织数据训练,实现既能生成高质量的图像视频,又能进行多轮对话式高可控精确编辑操作,显著提升了视觉生成的灵活便利性。

在图片生成功能方面,可支持多轮精准局部修改,如修改文字、修改背景、增加元素等。如「生成一张公交站牌,站牌上写着『5G』的图片」。

将5G替换为6G

站牌旁边停着一辆公交车

旁边还有一辆摩托车

改成涂鸦风格

图片动起来

在视频生成功能方面,构建统一可控生成体系,视频生成可控性进一步增强,支持基于个体轨迹控制的视频生成,视频续写,基于运镜控制的视频生成以及视频编辑能力。

针对基于个体轨迹控制的视频生成,提出层次化运动建模与动态特征对齐技术,突破长程依赖建模难题。

创新性地利用运动向量解耦与三模态协同控制技术,实现支持亚像素级路径和适配多曲率运动轨迹的视频轨迹控制能力。

基于运镜控制的视频生成技术,利用语义信息解耦和时序条件注入,并通过引入相机姿态信息,模拟真实物理世界成像规律,实现对生成视频运镜的精准控制。

视频编辑能力创新性引入自适应编辑模块和结构化噪声设计,有效提升用户指令跟随能力,保证编辑前后运动以及非编辑区域的视觉一致性。

视频编辑-删除操作

视频编辑-替换操作

多模态大模型在图理解和视频理解方面的性能表现也全面提升。图理解方面,采用了token-mixing策略与视觉重采样方案,巧妙地平衡了全局感知和细粒度感知能力,使得模型在处理更高分辨率的输入图像时,依然能保持出色的性能表现,进而实现了综合能力的显著提升。

在MMStar、HallusionBench和OCRBench等图理解任务中,九天模型分别获得了82.2、64.3和94.9的高分,OpenCompass综合评分79.5分,领先其他大部分模型。

视频理解方面,九天模型设计金字塔型记忆库结构和多层渐进式的视觉token融合方案,兼顾视频流中的时间和空间信息,提升模型对于长时视觉信号的理解能力。

在Videomme任务中表现优秀,超越Qwen2-VL和GPT-4o,在MVbench任务领先其余模型。

8月6日开始,九天将开展一系列技术直播,重点解析九天基础大模型、开源模型及数据集,锁定「九天人工智能」视频号,获取最新技术干货。

附录



九天开源模型和评测体系下载链接


1. 数学大模型:JT-Math-8B 系列模型

焕新社区地址(下载方式见文末):

JT-Math-8B-Instruct:

https://aihuanxin.cn/#/model?path=/model/detail/1463

JT-Math-8B-Thinking:

https://aihuanxin.cn/#/model?path=/model/detail/1464

JT-Math-8B-Base:

https://aihuanxin.cn/#/model?path=/model/detail/1459

Huggingface地址:

https://huggingface.co/JT-LM/JT-Math-8B-Base

https://huggingface.co/JT-LM/JT-Math-8B-Instruct

https://huggingface.co/JT-LM/JT-Math-8B-Thinking

ModelScope地址:

https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Instruct

https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Base

https://www.modelscope.cn/models/JiuTian-AI/JT-Math-8B-Thinking

github地址:

https://github.com/JT-LM/JT-Math-8B

gitee地址:

https://gitee.com/CMCC-jiutian/jt-math-8b.git

2. 代码大模型:JT-Coder-8B 系列模型

焕新社区地址(下载方式见文末):

JT-Coder-8B-Instruct:

https://aihuanxin.cn/#/model?path=/model/detail/1458

JT-Coder-8B-Base:

https://aihuanxin.cn/#/model?path=/model/detail/1466

Huggingface地址:

https://huggingface.co/JT-LM/JT-Coder-8B-Base

https://huggingface.co/JT-LM/JT-Coder-8B-Instruct

ModelScope地址:

https://www.modelscope.cn/models/JiuTian-AI/JT-Coder-8B-Base

https://www.modelscope.cn/models/JiuTian-AI/JT-Coder-8B-Instruct

焕新社区开源获取方式:

进入焕新社区(aihuanxin.cn),进入模型库/数据集,选择组织【九天人工智能】,快速获取九天最新开源内容。


<br>


    <a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&amp;mid=2652616413&amp;idx=1&amp;sn=49048545d9149e9d8bd5a9aba66dc2fc&amp;chksm=f0d76b0c8f9e4d748f6852746a636d2dca6fb4ee645f56a2b1f1ad6bc3c7a2ea031980d9fd9e&amp;scene=0#rd"  target="_blank">文章原文</a>
    <br>




<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/gyR2lBuuR9&amp;maxage=1y"  width="1px"></div></div></body></html>

联系我们