动态列表

  • Stability AI前CEO惊人预测:人类智力价值归零,只剩1000天!
  • 刚刚,奥特曼预言:人类「只剩」最后5年!
  • 免训练加速61倍!陈怡然团队新作DPad:仅关注「彩票token」
  • 估值840亿AI实验室再放大招,他们要给大模型戴上「紧箍咒」
  • 苹果掀桌!扔掉AlphaFold核心模块,开启蛋白折叠「生成式AI」时代
  • 复旦等揭秘机器人“大脑”安全漏洞:一张图就能让它“宕机”,攻击成功率76.2%
  • DASFAA 2025 | 湖大等提出SCRA-VQA:给LLM一份“精装修”的图像描述,无需训练提升VQA性能
  • 苹果官方旗舰店也放假,商品不发货;腾讯推「老年打车」服务;车主酒驾,智能驾驶「报警」|极客早知道
  • 刚刚,ChatGPT Pulse上线!私人秘书不再是富人特权
  • 颠覆算力格局!全球首个星座级太空AI算力服务,在中国诞生
  • OpenAI 3万亿美元测试,AI首战44个行业人类专家!
  • JHU教授揭秘学术潜规则:普通博士如何打破鄙视链翻盘?
  • Hinton预言错了!年薪狂飙52万美元,AI没有「干掉」放射科医生
  • 168 元一年的「小红卡」,是小红书打破本地生活红海的钥匙
  • 当 5 亿玩家涌入 AI 的 3D 新世界
  • 博士申请 | 香港中文大学(深圳)冀晓强老师课题组招收人工智能全奖博士/硕士
  • 128k死穴被击穿!Amazon爆改长上下文:段内压缩快4×,推理不掉点还更准
  • 普林斯顿陈丹琦组新作:RLHF难支撑,RLVR有边界?RLMT开辟第三条路
  • AI 到底会不会做生意?1688 的答案让人惊喜
  • 找人不求人?Lessie 让「人脉玄学」变成算法游戏|AI 上新
  • 斯坦福推出VisualMimic:让机器人“眼观六路”,零样本完成复杂任务
  • 浙大发布RS3DBench:让遥感AI看懂3D世界,首个像素级对齐的大规模基准来了!
  • 小米 17 系列发布,4499 起;追觅「库里南」图片曝光;YU7 Max 成「百万最速」车
  • 刚刚,LeCun团队开源首款代码世界模型!能像程序员一样思考的LLM来了
  • AI正在偷走白领工作!OpenAI狂砸10亿教AI上班,你的完美继任者即将上岗
  • Sora 2瑟瑟发抖!通义万相2.5放大招:一句话出1080P电影,音画精准同步
  • 信息熵之后,清华提出状态熵!量化分析「系统智能性」的全新视角
  • 突发!Meta刚从OpenAI挖走了清华校友宋飏
  • KV缓存不再爆!清华姚期智团队重写注意力维度,长上下文更省更强 | NeurIPS 2025 Spotlight
  • 78条打穿1万条!上交大新范式告诉你:智能体训练靠“质”,不是靠“量”
  • 北京内推 | 中科院软件所数据科学研究中心招聘大语言模型算法实习生
  • 三款骁龙芯片曝光,高通谷歌联手打造「安卓 PC」时代
  • Instagram 月活破 30 亿,靠“短视频”和“私信”;2027款iPhone曝光;女子用ChatGPT选号中百万大奖,全部捐出
  • 一年4次迭代,狂堆GPU成真!微软AI冷液灌芯,散热暴涨3倍
  • 刚刚,阿里CEO吴泳铭发布「ASI宣言」:超级智能才是终局!
  • 前Meta工程师爆料:17人团队15个H-1B!一夜之间80%对手没了?
  • 秘塔AI放大招!「边想边搜边做」,内置20+智能体,想法一键实现
  • 震撼!AI物理「双修」:亥姆霍兹方程嵌进生成器,伪影当场消失
  • OCRBench v2 25年9月最新榜单发布!揭示多模态大模型文档智能真实水平
  • 恶劣天气下的图像修复:南理工等提出LCDiff,让AI在雨雪雾天也能看得清
  • RL不再撒胡椒面!港科大 × 清华新作:只盯“规划token”,大模型推理力狂飙
  • NeurIPS 2025 | 甩掉文本CoT!FSDrive开启时空思维链,自动驾驶迈入视觉推理时代
  • 博士申请 | 加拿大麦吉尔大学智能自动化实验室招收大模型/强化学习方向全奖博士生
  • 3 天卖完今年所有产能,蔚来全新 ES8 如何实现逆风翻盘?
  • 超越 AGI,阿里剑指「超级智能」
  • ContextFlow:无需训练的视频编辑新范式,实现电影级魔改!
  • 字节跳动OmniInsert炸场:无需掩码,任意物体“贴”进视频,效果碾压闭源SOTA!
  • Point-SSM:一种用于点云分析的极简状态空间模型,在医学点云任务上表现SOTA
  • 忘了法拉利,一辆中国车正在改写游戏规则
  • 40亿投进去,换回了什么?全新问界M7的「值得」哲学
  • 华为问界新 M7,1 小时大定 3 万;李想:iPhone 17 顶配太丑,不买;防台风,腾讯「捆绑」QQ 企鹅塑像
  • 一半人明天不上班,GDP不会掉一点!耶鲁大学揭AGI残酷真相
  • 告别胶水代码,5倍飚速!无问芯穹首次揭秘,Infra智能体蜂群登场
  • Depth Anything再出新作!浙大 & 港大出品:零样本,优化任意深度图
  • H-1B「天价签证」引爆恐慌!印裔精英返乡梦碎,2800亿市场剧震
  • 突发:甲骨文CEO下台!刚和OpenAI签下3000亿美元大单,或因路线斗争
  • 年轻一代创作者,学会与 AI 共舞
  • KDD 2025 | 从个股偏离到市场共振:UMI挖出股市非理性因子,显著提升预测精度
  • 一套框架搞定图像定制!IC-Custom统一「位置相关/无关」,万物迁移真落地
  • 北京内推 | Apple中国招聘机器学习/AI方向研究型实习生
  • MiniCPM-V 4.5技术报告正式出炉!首个高刷视频理解多模态模型全解析
  • Yann LeCun团队新作LLM-JEPA:结合联合嵌入预测架构,显著提升大模型微调性能与效率,在代码生成任务上表现卓越
  • SilentStriker:无声击溃大模型
  • TPAMI | 数据增强还在“盲操”?南大提出IPF-RDA,让模型训练告别信息丢失
  • 小米 17 系列手机官宣 9 月 25 日发布;iPhone 17 标准款需求超预期,苹果已增产;罗永浩再回应债务问题:个人债务五年前就还完了,后面是主动还的公司债务|极客早知道
  • 比思维链准43%!逻辑脑+大模型直觉,推理可靠性大幅提升
  • 陶哲轩官宣AI数学基金首轮名单:29个项目瓜分1.3亿,数学界沸腾!
  • GPT-5仅23.3%,全球AI集体挂科!地狱级编程考试,夺金神话破灭
  • 一手奶瓶一手键盘!新手宝妈产假氛围编程,自研实用家庭App
  • 刚刚,DeepSeek-V3.1「终极版」重磅发布!最大提升超36%,V4/R2还远吗?
  • 为了千元机用户的「流畅权」,OPPO 为安卓换了个「引擎」
  • ​一年卖出 10 个亿,这是年轻人真正的「户外神器」
  • Teable 宣布完成数百万美元天使轮融资,让数据库「长出耳朵和手」
  • 博士申请 | 复旦大学魏龙老师课题组招收AI4Science方向博士/硕士/RA/实习生
  • Lumos-1登场!自回归 + 离散扩散合体:让大模型真正“构造”动态世界!
  • RLHF要下岗?Meta × 牛津搞出新套路:用算力教算力,大模型训练新范式来了!
  • 北京内推 | 智源研究院多模态交互研究中心招聘多模态/具身智能方向研究型实习生
  • 不到两千块,我拍到了专业级别的月全食|New Things
  • 字节跳动SAIL-VL2登顶OpenCompass,开源高效多模态新标杆
  • 博后年薪40万到90万 | 东方理工朱文韬课题组招聘AI方向博士后、研究助理教授、访问学生、实习生
  • 苹果发布Manzano:一种简单可扩展的统一多模态大模型,其混合视觉Tokenizer统一了理解与生成任务,性能SOTA
  • 黄仁勋出手,50 亿美元入股英特尔,英伟达一统「GPU+x86」生态
  • 巴菲特清仓比亚迪,期间股价上涨 38 倍;苹果折叠屏手机细节曝光;雷军年度演讲定档 9 月 25 日
  • 刚刚,Gemini「灵魂人物」官宣加盟xAI!马斯克火速转推背书
  • 靠10万+粉丝,北漂插画师秒贷款!华为全栈AI加速,让银行及时看见
  • 醒醒,LLM根本没有性格!加州理工华人揭开AI人格幻觉真相
  • 哈佛大佬都哭了!H-1B签证飙至10万刀,微软谷歌连夜召回全球员工
  • 马斯克xAI百天血战,100天狂招100人!联创实权被削,豪言干掉微软
  • 全球双榜SOTA!明略科技专有大模型 Mano开启GUI智能操作新时代
  • 谷歌Gemini IMO和ICPC夺金功臣之一被xAI挖走,马斯克直呼:起飞
  • 工业级3D世界构建提速90倍!全新框架LatticeWorld让虚拟世界「一句话成真」
  • 集合通信库VCCL释放GPU极致算力,创智、基流、智谱、联通、北航、清华、东南重磅开源
  • 【招生招聘】阿卜杜拉国王科技大学孟彦达博士组全奖博士、博后、实习、交流生
  • 告别视频“抽帧”理解,美国东北大学新算法GRT算法实现高效可扩展的高帧率密集视频理解
  • iPhone17 卖爆,官网发货延至双 11;比亚迪仰望 U9 赛道版开启预定;网友玩坏 iPhone「舌头刷抖音」

自动驾驶进入大模型时代,主机厂寻找「联合创始人」

「如果自动驾驶不能 Think Like Human(像人类一样思考),那它真的安全吗?」

9 月 25 日,一场关于自动驾驶未来技术路线的圆桌讨论在云栖大会上的 2025 阿里云汽车行业峰会展开。尽管三位嘉宾来自不同的主机厂或科技公司,对技术演进的具体细节也存在一些分歧,但他们都认可一个观点:自动驾驶应该从现在的「模仿学习」,迈向「自主思考」的下一阶段,以达到更安全、更可用的自动驾驶能力。

自主学习,换句话就是真正拥抱 AI,同时意味着更大的模型参数、更强的推理能力,以及更真实的仿真环境。

而这些,都离不开云端强大的「基建能力」支持。

事实上,不仅是智能驾驶的研发,在车企的企业管理提效、全球化拓展等各个业务维度里,「云」的能力无处不在。

数据显示:目前,阿里云为国内智能驾驶行业提供了 60% 的 AI 算力;95% 选择出海的车企都和阿里云有过合作关系;阿里云汽车行业公共云基础设施增速 132%。

AI 和它背后的「云」基建,正在像石油、电力那样,成为智能汽车时代必不可少的新基础设施。

 

智能驾驶,进入「大」模型时代

2025 年,想要在中国市场卖出任何一台新能源车,「智能化」都是绕不开的一个关键词。这其中,智能驾驶技术的体验和演进方向,又是每一家主机厂和智能驾驶公司关注的重中之重。

过去几年,特斯拉提出的「端到端」范式,引领智能驾驶研发从规则驱动切换到数据驱动时代。这轮技术变革既可以大幅提高开发效率,系统应对不同场景的泛化能力也得到了显著提升。

但关于端到端范式「天花板有限」的讨论也很快出现。根本原因在于,端到端就像是一位经历过「题海」洗礼的学生,模仿学习能力很强,见过的题可以不出错,但一旦面对没有见过的「新题」(也就是行业里常说的 corner case),它的自主解题能力就会受到考验。

而如果想要达到 L4 甚至 L5 级别的完全自动驾驶,就会面对数不清的没有被标记学习过的障碍物,以及无数没有被定义过的场景。

所以,在端到端之后,智能驾驶必须 AI 化。系统需要提升的是底层的「能力」,而不是人工开发一个个具体的「功能」。类比人工智能行业的发展,就是在预训练后,加入后训练和强化学习,增强推理能力。

在 2025 云栖大会汽车峰会上,三位嘉宾共同讨论 AI 时代的自动驾驶发展路线 | 图片来源:云栖大会

VLA(Vision-Language-Action)是近年来开始被行业热议,有望成为新共识的技术路线。依托于 GPT 架构的 VLA,参数量将大幅提升,也对研发的底座提出了新的要求:

首先,对算力的需求要远高于上一代技术范式。

这里既指需要更大算力的车端算力,也代表云端的训练、推理需求。理想汽车自动驾驶研发高级副总裁郎咸朋把在云端开发智能驾驶模式,比作「在虚拟城市里开极品飞车」,「不仅车的推理需要算力,生成这座模拟城市也需要大量算力」。

其次,VLA 中的「L」,其实是指对物理世界的理解——你可以简单理解为「基本智商」,例如看懂临时路牌、分辨潮汐车道、避让特种车辆(如救护车)等。这些和驾驶无关的常识能力,恰恰是现在的语言大模型已经具备的。

所以,主机厂在研发 VLA 模型的时候,往往是选择在行业领先的基座模型上进行蒸馏,而不需要从零开始重复造轮,再做一个大语言模型。

基于此,三位嘉宾在沟通时也都表示,在如今的智能驾驶研发过程里,阿里云不仅提供了 AI 算力,更是和车企、科技公司一起合作解决问题的好伙伴。

 

当智能座舱开始「自主服务」

在汽车智能化进入深水区的当下,智能座舱正经历从 "指令响应" 到 "主动服务" 的代际跨越;长城汽车技术中心副总经理姜海鹏提到,「座舱正经历着从基于规则到基于 AI 的重要转型,之前我们定义座舱是基于功能驱动性的,但未来的座舱一定是基于能力涌现性的。」

在 2025 云栖大会汽车峰会上,三位嘉宾共同讨论端云协同下的智能座舱新架构 | 图片来源:云栖大会

而大模型以及大模型的端云协同技术成为这一变革的核心牵引力。而在协同中,分工是核心关键。

就如在阿里云 ApsaraLive 对话中,阿里云智能集团公共云事业部 AI 汽车行业解决方案总经理霍健所举的例子:当乘客说我感觉有点冷,端云协同下新架构的智能座舱是 「车端确认调整温度意图后,云端会首先进行记忆召回,找到「他」过去对温度的偏好,提供给车端结合车外温度,车内温度,温度偏好做执行。」

AI 的核心能力分为思考、感知、记忆以及执行等几个维度。云端在深度推理和思考方面具有优势,但随着端侧算力提升,本地完成思考任务的能力也在增强。感知则主要由端侧承担,因为涉及声音、声纹、人脸识别及环境监测等敏感数据,要考虑安全与实时性。记忆功能需端云协同,短期记忆在端侧闭环处理,长期记忆经隐私处理后结构化上传至云端。就如蔚来汽车副总裁吴杰所说,从技术角度来看,针对不同的品牌和场景,我们都在探索不同的端云协同的黄金分割点。

而这种精妙协同配合不仅需要阿里云强大的云端能力,也离不开端侧大模型优秀的能力。

阿里云在这次大会上首次公布了他们最新的座舱领域车端与云端配套的全模态模型「Qwen3-Omni-Mobile」和「Qwen3-Omni-Flash」。它们有三大特点「端到端全模态的交互」 「主流芯片厂商全适配」 「0.5 秒超低延时」

在 2025 云栖大会汽车峰会上,阿里云智能集团的公共云事业部 AI 汽车行业总经理李强发布汽车专属全模态模型 | 图片来源:云栖大会

新的模型让智能座舱真正拥有了全模态的感知能力,让智能座舱不再只是一个听从明确指令的实习生,而是真正了解你需求的贴身 AI 助理。这标志着智能座舱即将迈入「自主行动」新阶段——即座舱能基于环境与乘员状态自主决策,而非依赖明确指令。

 

车企也在「自动驾驶」

除了在汽车产品上的自动驾驶和智能座舱研发外,其实现代车企在运营和管理体系上,也希望借助 AI 进行数字化转型之后的又一轮变革,实现「企业运营的自动驾驶」。

阿里云智能集团的公共云事业部 AI 汽车行业总经理李强曾经在一次和中国一汽的沟通中,表示过去的数字化解决了信息「能存」的问题,让车企流程的标准化和效率的提升;但系统并没有解决信息「能懂」的问题。所以企业过去的数字化转型,往往只能止步于八成,最后 20% 很难突破。

举个例子:传统数字化管理下,设备日志、客服录音、合同图片等数据,从企业技术层面来看隶属文字、语音、图片等不同模态,而在管理层面又存在「部门墙」这样的沟通问题,所以信息并没有做到极致的高效利用。

从「能存」到「能懂」,中国一汽的思路:从大模型中得到启发,把所有数据转换为「Token」,这样就可以把不同模态的内容映射到同一套 Token 空间里。这样,企业运行中的「上下文」就能变得丰富很多,管理企业的模型有了「长文本」的支持,自然也就更聪明了。

中国一汽体系数字化部副总经理陈韵分享一汽的数智化改革案例 | 图片来源:云栖大会

显而易见,要实现这种以「理解」为基础的智能化管理,AI 大模型是必需的基础设施。和自动驾驶一样,车企自研一套领先的基座模型不仅耗时耗力,也不是其业务重心。因此寻求最强有力的技术合作伙伴同样也很容易成为行业共识。

在中国一汽和阿里云的合作中,阿里云负责提供通义基座大模型,并提供一些「定向能力支持」;而一汽集团则将过去在数字化转型中积累的高质量行业数据,为模型提供了最好的训练语料。

这种合作的成果,体现为中国一汽发布的 OpenMind 智能体平台。

在 2025 云栖大会的现场,中国一汽体系数字化部副总经理陈韵从差旅智能交互助手、辅材数据协同范式、薪酬发放数字员工 3 个场景,分享了 OpenMind 平台的具体应用效果。

在这些应用场景里,共性在于这套基于 AI 的平台可以通过「纵向」(从管理层直达每个车间)、「横向」(打破不同部门墙)、「时空」(融合企业过去的案例)三个维度获得更全局的视角。

而在应用过程中,员工的工作重心也逐渐从执行好某一项具体业务,变为了做好「数据模型」,这不仅让中国一汽实现了提效,更是完成了企业运营范式上的一次彻底重塑,从依赖固定流程的刚性体系,迈向由数据驱动、智能体协同的柔性生态。

中国一汽与阿里云的实践也证明了,全栈 AI 云的支撑能力不仅限于汽车的产品力层面,更是驱动企业内部管理和运营模式从数字化迈向智能化,让车企获得更全面的「AI 化」竞争力

从自动驾驶向 「自主思考」 跨越,到智能座舱从 「指令响应」 转向 「主动服务」,再到车企运营实现从 「数据能存」 到 「数据能懂」 的突破,智能汽车的每一次进化,都深深扎根于 AI 与云基建的协同土壤。云厂商不再是单纯的算力供给者,而是与主机厂并肩的 「共创伙伴」,二者共同搭建的不仅是技术底座,更是重塑汽车智能生态的核心骨架。这场产业与技术的深度融合,正一步步将更安全、更智能的出行未来,从蓝图变为现实。

联系我们