动态列表

  • 突发!苹果AI大失血:Siri前掌门离职,核心团队被挖角,新功能延期到2026
  • 对Transformer说不!清华刘嘉:2045数字永生降临|新智元十年峰会
  • 急诊室生死逆转!酒后呕吐,GPT-5一眼锁定食管穿孔
  • 周周996,顿顿预制餐!美国AI界00后卷疯了: 住「棺材房」一周工作92小时
  • 学历越高,越怕熬夜!2.3万人10年研究实锤:睡得越晚,智力下降越快
  • Meta开源MobileLLM-R1模型,不到1B参数,用1/10的训练就超越了Qwen3
  • 清华、上海AI Lab等顶级团队发布推理模型RL超全综述,探索通往超级智能之路
  • 快手可灵团队提出MIDAS:压缩比64倍、延迟低于500ms,多模态互动数字人框架实现交互生成新突破
  • 数据与AI双引擎驱动智能未来,2025外滩大会论数据进化之道
  • iPhone 17 Air 在华发售延期;罗永浩直播回应西贝;《流浪地球》第三部剧本完稿,共计十五万字|极客早知道
  • 刚刚,谷歌发布71页AI科研报告!6大领域全面超越专家,几小时顶几个月
  • 一夜刷屏!27岁姚顺雨离职OpenAI,清华姚班天才转型做产品经理?
  • 王小川押注下个十年:为人类造医生,为生命建模型|新智元十周年峰会
  • 一刀砍掉90%训练成本!Qwen3-Next用1/10算力练成「长文推理利器」
  • AI意识「觉醒」!图灵得主Bengio重磅发声:AI正接近人类意识临界点
  • 扩散语言模型也有MoE版本了!蚂蚁&人大从头训练LLaDA-MoE,即将完全开源
  • 如何为LLM智能体编写工具?Anthropic官方教程来了
  • 腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破
  • 北京/上海内推 | 小红书智能审核算法团队招聘NLP/多模态内容理解算法工程师/实习生
  • 「做笔记」的RAG来了!告别噪声与骨牌效应,EviNote-RAG稳住长链推理
  • KDD 2025最佳论文亚军:参数不同还能共训?异构知识迁移框架HtFLlib全面开源
  • Adam的Update RMS为何总是0.2?噪声模拟到理论近似全讲透
  • 我苦寻的「库乐队」,叫 MiniMax Music 1.5
  • Science Advances | AI for Earth:聆听海洋的「脉搏」,新一代AI大模型精准预测十年气候脉动
  • 外滩大会嘉宾锐评AGI即将“撞墙”,正在向数字与物理世界进化
  • 港科大 X MiniMax:高质量数据、小模型挑战复杂网络搜索难题
  • 为了网罗 AI 创新者,上海搞了场万人科创大赛
  • 蚂蚁集团数字蚂力首批专家级“AI数字员工团队”亮相外滩大会
  • “IIFAA数字卡包”上线支付宝:目前已支持多类身份申领
  • 蚂蚁集团加码AGI等青年人才培育,2025蚂蚁InTech奖在外滩大会揭晓
  • 重塑药物研发,哈佛医学院等开源全新AI模型,用「图神经网络」破解疾病驱动因素多元难题
  • 全球最懂智能体的创业者齐聚外滩大会,未来三年怎么做聊透了
  • 马上上岛|云栖大会「新世代 AI 创想岛」即将揭幕
  • ICRA 2025 | TANGO:机器人告别3D地图,仅靠RGB摄像头实现零样本长距离导航
  • 挑战主流认知!蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型
  • 姚顺雨离职OpenAI,「亿元入职腾讯」传闻引爆AI圈,鹅厂辟谣了
  • 全新MoE架构!阿里开源Qwen3-Next,训练成本直降9成
  • 告别错误累计与噪声干扰,EviNote-RAG 开启 RAG 新范式
  • 西贝贾国龙称一定起诉罗永浩;支付宝推出「AI 付」服务;iPhone 17 京东、天猫预订量比上代大增|极客早知道
  • 刚刚,ChatGPT支持MCP了!一句Prompt即可全自动化
  • 百度CTO王海峰:AGI曙光已现,Scaling Law仍有效|新智元十周年峰会
  • 通用Agent是伪命题?昆仑万维方汉现场拆解:垂直推理才是胜负手|新智元十年峰会
  • 文心X1.1三大能力狂飙,海内外实测还挺惊艳!
  • 超越90%城市规划师!清华、MIT等提出人机协作新范式 | Nature子刊
  • 慕尼黑车展,当冷静遇上冷静
  • 别再狂刷CoT了!港科广DIGAI Lab发布隐式推理全景综述,静默思考开启新范式
  • 博士申请 | 新加坡国立大学计算机系卞亚涛老师招收2026 Fall人工智能全奖博士/博后
  • 继首创“AI打赏”服务之后,支付宝再推国内首个“AI付”
  • 蚂蚁百宝箱新品Tbox超级智能体亮相外滩大会,5分钟即可完成专业教学素材
  • 量子宇宙模拟竞赛开启:量子计算机可以模拟并阐明复杂物理现象
  • 3000亿美元OpenAI大单,让世界首富位置换人了
  • 攻克大模型「表格盲区」!ST-Raptor框架发布,实现复杂半结构化表格的精准理解与信息抽取
  • 港大马毅外滩大会演讲:人工智能应从“黑箱”走向“白箱”
  • 兼顾准确率与可解释性,DeepSEA实现抗生素耐药蛋白注释范式转变
  • 交互扩展时代来临:创智复旦字节重磅发布AgentGym-RL,昇腾加持,开创智能体训练新范式
  • RewardDance:字节跳动提出视觉生成奖励扩展新范式,破解“奖励劫持”难题
  • 刚刚,Thinking Machines Lab首次发长文,揭开LLM推理不确定性真相
  • 英伟达的AI已经开始接管整个项目了?SATLUTION自主进化代码库登顶SAT竞赛
  • 大模型智能体不止能写代码,还能被训练成白帽黑客
  • 高德扫街榜,能不能做成中国的「Google Map」?
  • 开启MPV家庭新时代,魏牌高山7正式启动预售
  • ACL最佳论文幕后的北大人!北大张铭带出顶会常胜军和百亿CEO天团|新智元十周年峰会
  • 刚刚,这款Agent浏览器力压OpenAI,72%成功率全球第一!还能免费用
  • =COPILOT()函数横空出世!AI自动写公式效率起飞,网友:让Excel再次伟大
  • 当智能醒于物理世界,英伟达副总裁: 下一个十年属于物理AI!|新智元十周年峰会
  • 刚刚,英伟达祭出下一代GPU!狂飙百万token巨兽,投1亿爆赚50亿
  • 00后挑大梁!近20国选手激战外滩大会,AI科创赛三赛道冠军诞生
  • CoRL 2025 | 港大InfoBodied AI团队首发具身表征新范式,构建任务自适应的感知框架
  • 英伟达下一代GPU登场,Rubin CPX一次推理数百万Token,网友:这是头野兽
  • 谷歌AI新里程碑:一个能「做研究」的系统诞生了,用LLM+树搜索编写专家级软件
  • 爱诗科技完成6000万美元B轮融资,阿里巴巴领投,达晨财智、深创投、北京市AI基金、巨人网络、Antler等跟投
  • 当人工智能「看见」量子世界:AI如何改变对复杂量子系统的认知,南洋理工、上交等发布量子系统学习综述
  • SFT真不如RL?MIT团队抛出“RL的剃刀”,砍掉遗忘直通终身学习
  • 院士领衔!从智能算网到司法AI:顶尖学者直播解读AI与工程前沿趋势
  • DeepSeek、Gemini都不行?AgenTracer锁定多智能体“背锅侠”,8B小模型反超闭源巨模
  • 北京内推 | AMD北京AI算法团队招聘模型量化/剪枝算法实习生(可远程)
  • AI应用元年,这场标杆赛事见证了中国创新速度与野心
  • AI胡说八道这事,终于有人管了?
  • 人人都能炼专属Agent,上海交大开源端侧Agent全栈工具链,真实场景性能超GPT-5!
  • TPAMI 2025 | H2OT:分层沙漏型Tokenizer,重塑高效视频姿态Transformer
  • 史上最贵「打工皇帝」!马斯克解锁1万亿美金工资,拢共分几步?
  • 500 块的「电子宠物」,治好了我的「路怒症」|New Things
  • 苹果发布会:耳机测心率、手表听音乐、iPhone Air超级薄
  • 5999 元起,苹果发布eSIM、超薄 iPhone;王腾再辟谣离职原因谣言;反恶性补贴,主要外卖平台被约谈|极客早知道
  • 不到10天,国产「香蕉」突袭!一次7图逼真还原,合成大法惊呆歪果仁
  • 再也不怕面瘫脸!YouTube黑科技:AI帮你「永久微笑」,连僵尸都咧嘴笑
  • OpenAI真正王牌,不是Ilya!刚刚,奥特曼罕见致谢这两人
  • 缔造OpenAI的秘密,竟只有一个词!新智元十年峰会圆桌,七位大咖激辩
  • Hinton预言失灵?掌握AI技能涨薪23%,比读硕士更赚钱
  • 最薄 iPhone 登场,eSIM 正式落地|苹果秋季发布会新品回顾
  • 文心新出的推理大模型,给了我们信心
  • SFT远不如RL?永不过时的剃刀原则打开「终身学习」大模型训练的大门
  • 从第一性原理出发的RAG推理新范式来了,蚂蚁DIVER登顶权威基准
  • 击败多个行业巨头,优必选自研人形机器人最强大脑 Thinker 斩获全球四项第一
  • 字节跳动发布 Seedream 4.0 图像创作模型,豆包、即梦可免费体验
  • 从科幻到产业元年 | 「脑机接口」系统综述发布:全景解析理论、技术、挑战、趋势
  • 硅谷也996实锤了?AI的火,烧掉了硅谷的周末
  • DPad: 扩散大语言模型的中庸之道,杜克大学陈怡然团队免训推理加速61倍
  • Altman亲自发博客点赞,这两大杰出人才是谁?
  • 自变量机器人完成近 10 亿元 A+ 轮融资,多元资本押注共同布局具身智能未来
  • 报名启动!西湖大学云谷青年学者论坛·人工智能分论坛诚邀全球英才
  • 不止综述!多模态大模型持续学习全链路:Benchmark、方法与Codebase一网打尽
  • ICML 2025 | 别再只拼CoT了!不完备信息下的主动推理,LLM普遍掉线
  • 科研实习 | 北京大学计算机学院潘亮铭老师课题组招收NLP/大模型方向科研实习生
  • 时空壶发布 W4:用「硬核」技术,打赢一场 AI 翻译的「标准」之战
  • Science | 西奈山伊坎医学院新AI算法为1600种变异定量「风险」,解析疾病外显率难题
  • TPAMI 2025 | IGEV++:迭代多范围几何编码,刷新立体匹配技术新高度
  • 原来你是这样的外滩大会!
  • 小米通报王腾因泄密被辞退,本人发微博回应;传 IPO 估值 500 亿,宇树回应 ;辛顿自曝被女友用 AI 分手 | 极客早知道
  • Hinton自曝:前女友提分手,用ChatGPT列出自己「七宗罪」
  • 从「会说」迈向「会做」,LLM下半场:Agentic强化学习范式综述
  • 字节Seedream 4.0将全量开放!抢先评测来了,我们摸索出AI生图20种「邪修」玩法
  • 全球图生视频榜单第一,爱诗科技PixVerse V5如何改变一亿用户的视频创作
  • 扎克伯格的豪赌初见成效?Meta新方法让LLM长上下文处理提速30倍
  • 具身VLA后训练:TeleAI提出潜空间引导的VLA跨本体泛化方法
  • 上海AI Lab重磅综述:AI实现自主科学发现时代已经到来
  • 6 个月估值暴涨 5 倍突破 100 亿美元,三个「00后」逼急 Scale AI
  • 给RL装上“防抖器”!GRPO稳化版来了:更高熵、更低KL、更稳更新
  • 导师放养真的会毁掉一个人……
  • 深圳内推 | 腾讯音乐天琴实验室招聘音乐生成算法研究员(社招/校招)
  • Focal Loss也能无监督?北大×港中文团队用“双重不确定性优化”提升鲁棒3D感知
  • 上汽通用五菱与华为深化合作,推出首款车型宝骏华境S
  • IEEE TPAMI | M²Diffuser: 让机器人学会“脑补”,在复杂3D场景中实现精准移动操作
  • 国行版苹果 AI 推迟至年底上线;视频平台广告被曝「偷时间」;美国计划限制进口中国无人机和重型载具 | 极客早知道|极客早知道
  • 16岁创业,22岁做成百亿独角兽!3位高中同学帮大厂训AI年入1亿美金
  • 《2025新智元ASI前沿趋势报告》全文
  • 一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发
  • 苹果端侧AI两连发!模型体积减半、首字延迟降85倍,iPhone离线秒用
  • Claude不让我们用!国产平替能顶上吗?
  • SceneSplat: 基于3DGS的场景理解和视觉语言预训练,让3D高斯「听懂人话」的一跃
  • 慕尼黑车展 2025前瞻:中国队组团出海,BBA 走向「新」时代
  • 国内外AI大厂重押,初创梭哈,谁能凭「记忆」成为下一个「DeepSeek」?
  • 斯坦福:优化器「诸神之战」?AdamW 凭「稳定」胜出
  • 字节跳动Seed推出「机器人大脑」Robix:让机器人学会思考、规划与灵活互动
  • 浙大提出SSGaussian:注入语义与结构灵魂的3D风格迁移,让高斯溅射场景化身艺术品
  • 苹果 iPhone 17 系列规格已全被曝光;Anthropic 全面封杀中国公司接入;今夜将迎来「血月」月全食|极客早知道

Arm拥抱AI:五倍性能,三倍能效

构建芯片架构的 Arm,也全面拥抱 AI 了。

9 月 10 日,在上海举行的活动上,Arm 全新 Arm Lumex 计算子系统(Compute Subsystem,CSS)平台正式全球发布。作为每年全球新款手机 SoC 的核心,今年的 Arm 解决方案重磅更新,让人们不得不关注。

在连续使用二十年 Cortex 命名之后,Arm 的端侧高性能 CPU 核心已被重命名为 C1 CPU,隶属于 Lumex CSS 平台,该平台专为旗舰手机、个人电脑设计,着重于加速 AI 体验。

这体现了 Arm 从「IP 提供商」向「计算平台解决方案提供商」转变。除了移动端,Arm 还在多个产品线上部署计算平台,包括面向基础设施市场的 Neoverse、面向 PC 市场的 Niva、面向汽车市场的 Zena 和面向 IoT 市场的 Orbis,所有计算平台都引入了 Arm 计算子系统 (CSS)。

在端侧 GPU 上,Mali 将继续作为 GPU 品牌,不过在新一代技术的发布中,Arm 同样提升了光追、AI 加速等能力。

Lumex CSS 平台集成了搭载第二代可伸缩矩阵扩展(SME2)技术的最高性能 Arm CPU、GPU 及系统 IP,不仅能助力生态伙伴更快将 AI 设备推向市场,还可支持桌面级移动游戏、实时翻译、智能助手及个性化应用等多样的丰富体验。

Arm 高级副总裁兼终端事业部总经理 Chris Bergey 表示:「AI 已不再仅仅是一项技术功能,它已成为下一代移动与消费技术的支撑底座。依托 Arm Lumex 平台,我们持续提升端侧 AI 体验,以满足用户日益增长的需求与期待。为此,我们正积极将 SME2 技术扩展至每一个 CPU 平台。预计到 2030 年,SME 与 SME2 技术将为超过 30 亿台设备新增超 100 亿 TOPS 的计算能力,为端侧 AI 带来大量全新应用。」

全新 Arm Lumex 平台包含以下核心组件:

  • 新一代搭载 SME2 技术的 Armv9.3 CPU 集群:包括 Arm C1-Ultra 和 Arm C1-Pro,为旗舰设备提供支持;
  • Arm C1-Premium:专为次旗舰市场打造,可提供一流的面积效率;
  • Arm Mali G1-Ultra GPU:配备新一代光线追踪技术,在实现先进的图形和游戏体验同时,还可提升整体 AI 性能;
  • Arm C1-DSU:Arm 迄今为止最灵活、高能效且具多种电源模式的 DynamIQ Shared Unit(DSU)。

Arm 表示,Lumex 提供针对 3 纳米工艺优化、生产就绪的 CPU 和 GPU 实现。同时,KleidiAI 已集成至所有主流移动操作系统及 AI 框架中,可以帮助开发者提供易用的 AI 加速体验。

Arm 新发布的 IP 核也包括中核 C1-Pro 及小核 C1-Nano。

Arm Lumex 是 Arm 新的专用计算子系统 (Compute Subsystem, CSS) 平台,旨在满足旗舰移动设备和 PC 上持续增长的端侧 AI 体验需求。搭载 SME2 的 Arm C1 CPU 集群为实际场景上的 AI 驱动任务带来了大幅度的 AI 性能提升,整体 AI 性能提升高达五倍,多达三倍的能效优化,语音类工作负载延迟降低 4.7 倍,音频生成速度则可以提升 2.8 倍。

全新 Arm CPU 在 AI 算力上的提升,正在让实时的端侧 AI 推理成为现实,为用户在音频生成、计算机视觉及情境助手等多种交互场景中带来更流畅、更快速的体验。

在基础性能上,借助全新的 Armv9.3 CPU 集群,Arm Lumex 也实现了两位数的 IPC 提升。

在大核心的 Arm C1-Ultra 上,其提供的 IPC 提升能达到两位数,单线程峰值性能提升 25%,同性能功耗降低 28%(相比 Cortex-X925)。

Arm C1-DSU 在 Arm C1 CPU 集群中起到核心作用。C1-DSU 为支持最新的架构和新的低功耗特性而设计,对比上一代 DSU-120 能节省功耗高达 26%,同时提升带宽的扩展能力,对于生成式 AI 的推理速度来说,这是非常重要的提升。

在业内主流基准测试上,Arm C1-CPU 集群相比上一代 CPU 集群性能平均提升 30%,在游戏和视频流媒体等应用中平均提速 15%。与此同时,在日常移动端工作负载如视频播放、社交 App、网页浏览上,新 CPU 的功耗平均降低了 12%。

在实际场景中,SME2(Scalable Matrix Extension 2,可伸缩矩阵扩展)技术将响应速度与运行效率提升至全新水平。得益于 SME2 技术,本地 AI 应用的文本转语音生成速度提升了 2.4 倍,且全程不用担心设备的电池续航问题。此外,Arm 与支付宝、vivo 三方合作,将大语言模型 (LLM) 的交互响应时间缩短了 40%,充分证明了 SME2 可为终端设备带来更快速的实时生成式 AI。

SME2 技术的价值不仅在于速度的提升,更在于释放出传统 CPU 无法企及的 AI 驱动功能。例如,在搭载 SME2 的单个核心上运行神经摄像头降噪功能,可以在 1080P 分辨率下实现帧率超 120 帧 / 秒 (fps),或在 4K 分辨率下实现帧率达 30fps。这使得智能手机用户即使身处光线最暗的场景,也能捕捉到更锐利、清晰的图像,进而在日常设备上获得更流畅的操作交互与更丰富的使用体验。

Arm 表示,SME2 已经被业界生态伙伴广泛采用,包括阿里巴巴、支付宝、三星 System LSI、腾讯及 vivo。

开发者可以在 Arm Lumex 平台上获取开机即用的 AI 开发体验。通过 KleidiAI 与各大主流框架的集成,包括 PyTorch ExecuTorch、Google LiteRT、阿里巴巴 MNN 及微软 ONNX Runtime,开发者无需修改任何代码,即可自动取得 SME2 的加速能力。

同样提升巨大的还有 Arm 的「公版」GPU。全新的 Arm Mali G1-Ultra GPU 为手游玩家带来高保真、主机级画质。这一突破得益于全新的第二代光线追踪 (Ray Tracing Unit v2, RTUv2) 技术,该技术显著提升光照、阴影与反射效果,使其光线追踪性能相较前代提升了两倍。

与上一代 RTUv1 相比,RTUv2 的智能化程度有了提升,由于采用了单光线模型,增加了对于非一致性光线的支持。新设计提升了 GPU 的能效和性能。Arm 工程师表示,RTUv2 可在渲染空闲时不消耗资源,从而大幅节省电力。

在 AI 工作负载方面,Mali G1-Ultra 可将推理性能提升最高 20%。与此同时,新 GPU 的每帧能耗降低了 9%。

在各类图形基准测试中,Mali G1-Ultra 较前代产品 Arm Immortalis-G925 GPU 实现了约 20% 的性能提升,为《暗区突围:无限》、《堡垒之夜》、《原神》、《崩坏:星穹铁道》等主流游戏带来了全面的性能增强。除了顶配的 G1-Ultra,Arm 也提供 Mali G1-Premium 与 Mali G1-Pro 两款 GPU,为硬件资源受限的设备提供出色的性能与能效表现。

Arm 还计划在明年提供基于神经网络的图像增强能力,实现手机端侧的去噪、AI 插帧等能力,预计在明年就能落地。

总体而言,Arm 根据当前 AI 应用即将大规模落地的情况,在移动端芯片上提供了新的系统级 IP 以及整合。在新架构中,通过内部互联能力升级,Arm 提供了更有效的解决方案,进一步减小了吞吐延迟,实现了系统级的 AI 性能改进。这些提升可适用于低端机、可穿戴设备,为最广大的用户群体带来了生成式 AI 的可能性。

即使目前正在所有产品线上推动 CSS 服务,Arm 表示其仍然主要关注芯片设计领域上 CPU、GPU 等基础计算模块的构建。对于芯片厂商来说,人们仍需要自行设计、构建或购买、内存控制器、NPU、ISP、通信基带等并实现整合。

众多手机 OEM 厂商开始自研芯片。Arm 表示,合作伙伴可以灵活选择使用 Arm Lumex 的方式,为其打造系统级芯片 (SoC)。例如,他们可直接采用 Arm 交付的平台,并借助为其需求定制的先进物理实现方案,从而获得缩短产品上市时间和快速兑现性能价值等双重优势;或者,合作伙伴也可根据他们的目标市场,对平台寄存器传输级 (RTL) 设计进行配置,并自行完成核心模块的硬化工作。

Arm 预计到 2030 年,SME 和 SME2 将为超 30 亿台设备新增超 100 亿 TOPS 的计算能力。这将使端侧 AI 能力实现指数级飞跃,它将降低成本、减少延迟、增强隐私,整体提升用户体验。

]]>

联系我们