动态列表

  • 图灵奖得主LeCun最后警告Meta!我搞了40年AI,大模型是死路
  • AI又封神了!华人新作直出憨豆+《猫和老鼠》,平行宇宙对上戏了
  • AI「逼宫」库克?苹果秘密计划曝光,接班人竟是M芯片之父!
  • 年度最强AI压轴!谷歌Gemini 3.0下周决战OpenAI,前端要下岗了
  • ICLR 2026吃瓜现场:有人用LLM连投4版论文,竟然拿到两个8分?
  • 无人工标注、可持续扩展:AcademicEval推动长文本评测进入“自更新”阶段
  • 宇树完成上市辅导,拟境内IPO;传索尼开发Labubu电影;2699元!原道X小岛秀夫耳机限量发售
  • AAAI 2026 Oral | 清华大学等提出SpatialActor:解耦空间感知,重度噪声下机器人操作鲁棒性暴涨19.4%
  • AI不懂痛苦,却成了你的深夜知己!170位医生教ChatGPT安慰人
  • 一条短信,7年恩怨!奥特曼与马斯克决裂曝出新隐情
  • 不会说英语的母亲,教出了5万亿英伟达CEO!
  • AI「牛顿」来了!北大团队新突破,看一眼数据就能推出物理定律
  • AAAI 2026 Oral | 中科院联合港大提出ARRA:外部视觉表征对齐重塑全局一致性,让自回归大模型充分释放图像生成潜能
  • 1899 元「iPhone 袜子」上架秒光;传华为 Mate80 上 20GB 内存;微信点赞苹果小程序政策
  • 全球最大开源具身大模型!中国机器人跑完马拉松后开始学思考
  • OpenAI拆开AI「黑箱」,终于可以看懂GPT在想什么了
  • LeCun在Meta的「最后一作」
  • 视觉压缩称王?谷歌死守AI黑科技,DeepSeek一夜开源
  • 大疆 OSMO Action 6 体验:完美进化,不止运动
  • iOS 为微信小程序「正名」,腾讯移动生态的新转机
  • WACV 2026 | PALMS+:融合深度基础模型,手机室内导航的技术再突破
  • “全模态”3D视觉基础模型OmniVGGT出炉!即插即用任意几何模态,刷新3D视觉任务SOTA,赋能VLA模型
  • GPT 5.1 发布了,但西方媒体准备「讲好中国故事」
  • AI、游戏双驱动,腾讯「赚麻了」
  • 对话李彦宏:Chatbot 不是一切,我在 AI 上看到了更让人兴奋的未来
  • OpenAI把Transformer训练成「几乎全零」,黑箱首次被彻底揭开
  • 杭州/北京内推 | 阿里淘天算法团队招聘多模态理解方向算法实习生
  • ACL 2025 | 用图结构让RAG学会「记忆与总结」,重塑长上下文理解
  • 传苹果从微信小程序抽成 15%,腾讯回应;特斯拉考虑支持 CarPlay;iPhone Air 成功支持实体卡 |极客早知道
  • 谷歌DeepMind最新论文,刚刚登上了Nature!揭秘IMO最强数学模型
  • ICLR 2026出分,审稿员怒喷「精神病」!DeepMind研究员教你绝地求生
  • GPT-5.1发布当天,文心5.0杀回来了
  • 一句「你还好吗」值40亿?斯坦福博士出走xAI,押注AGI共情力
  • 营收狂飙的「暗面」:Meta成「全球欺诈大本营」?
  • 小鹏科技日「太魔幻」:机器人走猫步,飞行汽车接近量产
  • Roboflow&CMU论文披露RF-DETR细节:首个COCO数据集突破60 AP实时目标检测,速度飙升20倍!
  • AAAI 2026 Oral 中科大联合西工大提出RSKT-Seg:专为遥感打造的高效开放词汇分割框架,推理提速2倍
  • 深度研究智能体真的“懂你”吗?OPPO × 浙大首发个性化深度研究评测基准
  • 博士申请 | 佛罗里达大学计算机系招收NLP/LLM方向全奖博士/实习生
  • DeepSeek罗福莉正式亮相小米AI;「周杰伦概念股」联手宇树造 IP 机器人;乘用车百公里加速不少于5秒
  • 奥特曼下注27岁神秘青年,「复活」世界最顶级实验室
  • AI秒破18世纪「天书」账本!谷歌新模型盲测刷屏全网
  • Llama 4造假丑闻幕后:小扎豪赌143亿,却为中国AI「做了嫁衣」
  • 少年沉迷AI自杀,9岁遭性暗示!这门「孤独生意」,正推孩子入深渊
  • NeurIPS 2025 | 中科院携手快手发布LiveStar:首个“会说话、懂沉默”的直播AI,推理速度提升1.53倍
  • ConsistEdit:重新定义AI视觉编辑,港科大、清华等机构提出MM-DiT注意力控制新方法
  • 北京内推 | 阿里高德地图团队招聘大模型方向算法实习生(可长期/转正)
  • AAAI 2026 | 悉尼科技大学 × 港理工推出 FedVLR:让联邦推荐也能“懂图文”
  • 双十一算力真敢卷!RTX 5090低至0.69元/时,同预算跑更多实验
  • 对话元理智能张帆:为什么「商业强化学习」,才是 AI To B 的新出路
  • 深度复盘:大疆是如何成为影像领域新巨头的?
  • 传李想亲抓人事,华为系高管退出理想;Meta 首席 AI 科学家杨乐昆离职创业;AI 减肥或致饮食失调
  • Nature子刊:太空中建数据中心,无限能源,浙大首次证实可行!
  • 英伟达铁幕之后,谷歌AI芯片已成气候
  • 翻译界的ChatGPT时刻!Meta发布新模型,几段示例学会冷门新语言
  • 硅谷GPU蒙尘,马斯克一言成谶:美国AI被电卡脖子
  • 65岁图灵巨头离职创业!LeCun愤然与小扎决裂,Meta巨震
  • 年产值突破 150 亿,刚毕业的俊男美女涌入「团播」工厂
  • 马斯克想要 1 万亿,何小鹏只想等一句「牛 P」
  • 通往AGI的歧路:上海AI Lab重磅发现,自进化智能体可能“错误进化
  • 全模态到底是不是“1+1>2”?美团UNO-Bench揭示单模态与全模态能力的组合规律
  • 北京内推 | 百度文心一言基座团队模型组招聘大模型方向研究型实习生
  • NeurIPS 2025 | 上交大、南农大提出ADPretrain:为工业异常检测量身打造的预训练“超能力”
  • 3DV 2026 | 特伦托大学等提出DEMO:让AI看懂复杂人体动作,实现密集描述新范式
  • 小米汽车 10 月销量近 5 万,YU7 超 Model Y;美团 AI 编程工具开启公测;马化腾王传福成智元机器人受益股东
  • AI版PUA!哈佛研究揭露:AI用情感操控,让你欲罢不能
  • AI领域全新热门职业,岗位需求今年已增长逾800%
  • 硅谷10万大裁员真相:AI根本没想取代你,是老板想干掉你
  • OpenAI试图绑架美国政府,奥特曼还有救命底牌?
  • 全球68%科研人压力爆表,高校AI人才集体大逃亡!
  • 「传统教育」的船快沉了,人们却还在挤「头等舱」
  • 保暖?排汗?时尚?户外运动装备这道「选择题」,亚瑟士要打破「不可能三角」
  • EMNLP 2025 | 别再只看KV了!LLM越深越稀疏:UNCOMP用矩阵熵给出答案
  • 北京内推 | 腾讯AI Lab招聘大模型/多模态大模型方向研究型实习生
  • 过去五年,BERT都在被“过度训练”?LeCun团队给出Encoder算力最优范式
  • 在 Cursor 工作 60 天,我发现了这家公司成功的秘密
  • 这款 AI 写作神器,让数百网文作者「月入过万」|AI 上新
  • ACM MM 25 当MLLM遇上行人重识别:是“降维打击”还是“水土不服”?深度评测来了!
  • AI“世界模型”离真实手术还有多远?首个外科视频生成基准SurgVeo揭示“合理性差距”
  • 美国AI巨头股缩水8000亿美元;传Meta靠诈骗广告收入超千亿;《英雄联盟》S15总决赛T1夺冠|极客早知道

安谋科技发了一枚 NPU,要把 AIGC 算力提升 10 倍

去年一本讲述周朝灭商的历史学著作《翦商》,让不少人对于商朝这个传说中的朝代,有了完全不同于《封神榜》中神仙妖怪的认知。

作者李硕认为,周文王作为边缘民族的头领,被商王囚禁在地牢里自己弄出的「周易」,本质是私下利用了当时流行的占卜技术,来预测未来推翻商朝可能性大小。

文王的儿子武王,成功推翻商朝后,在周公旦的努力下,「周易」变成了之后知名的《易经》,变身成中国文化中神秘科技的代表。

其实,如果扩大一些视角,《易经》代表的几千年前的科技巅峰,和当下最流行的大模型技术引领的 AI 多少有些相似之处——都是利用算力来预测未来。关键在于,几千年前人们用的是木棍和脑力,现在,用的则是芯片,此事在刘慈欣的《三体》中亦有记载。

随着 AI 大模型技术从云端向边缘侧、端侧设备下沉,一场围绕端侧 AI 算力的「军备竞赛」已经打响。从智能手机、AI PC 到智能汽车,消费者对设备本地运行 AIGC 的需求正迎来爆发性增长。然而,要在功耗、散热和成本都受到严格限制的端侧设备上,高效运行动辄数十亿参数的大模型,整个行业都面临着算力受限、能效要求严苛、带宽瓶明等一系列严峻挑战。

正是在这一行业背景下,11 月 13 日,安谋科技(Arm China)在上海正式发布了「周易」X3 NPU IP。这不仅是安谋科技 Arm China 明确「All in AI」产品战略后推出的首款重磅产品,也被视为其「AI Arm CHINA」战略发展的关键实践。安谋科技 Arm China 毫不掩饰其目标,即直面端侧 AI 大模型运行的难题,打造计算效率的新标杆。

 

为 Transformer 和浮点计算而生

半导体 IP 行业的一个共识是,产品研发必须「面向未来 5 年进行前瞻布局」。安谋科技 Arm China 产品研发副总裁刘浩在发布会上也强调了这一点,他表示公司将持续加大投入,以「前瞻性视野整合顶尖研发资源」,并秉持「开放合作理念」,为伙伴提供从硬件到软件的端到端解决方案。

「周易」X3 正是这一前瞻性布局的产物。安谋科技 Arm China NPU 产品线负责人兼首席架构师舒浩博士指出,X3 的产品优势源于其「通用、灵活、高效且软硬协同的系统架构设计」。

这种前瞻性首先体现在架构上。「周易」X3 采用了一种专为大模型而生的最新 DSP+DSA 架构。它在设计之初就深刻理解了 AI 模型的演进趋势——即从传统的 CNN(卷积神经网络)全面转向 Transformer(大模型的基础架构)。

 

因此,X3 采用了「兼顾 CNN 与 Transformer 的通用架构设计」 ,使其既能高效处理传统的 AI 任务,也能从容应对未来几年的 Gen AI(生成式 AI)、Agentic AI(代理 AI)与 Physical AI(具身智能)的端侧落地需求。

这种新架构带来的另一个关键转变,是对浮点运算的强力支持。传统 AI 运算(如安防)大多使用定点计算,而大模型推理则高度依赖浮点(FP)运算。X3 全面增强了浮点运算(FLOPS)能力,支持从定点到浮点计算的关键转变,为承载大模型奠定了技术基石。

 

解码 10 倍 AIGC 算力

如果说架构是蓝图,那么性能数据就是最直观的成果。相较于上一代产品,「周易」X3 在 AIGC 大模型能力上实现了高达 10 倍的增长。这一惊人的跃升并非单一因素造就,而是由 16 倍的 FP16 TFLOPS(每秒万亿次半精度浮点运算)、4 倍的计算核心带宽,以及超过 10 倍的 Softmax 和 LayerNorm(均为大模型关键算子)性能提升共同驱动的。

在具体规格上,「周易」X3 的单 Cluster(集群)最高支持 4 个 Core(核心),可提供 8 至 80 FP8 TFLOPS(每秒万亿次 8 位浮点运算)的算力,并且支持灵活配置。其单核带宽高达 256GB/s。即使在传统的 CNN 模型上,其性能也比 X2 提升了 30%~50%。

但对于大模型而言,峰值算力(TFLOPS)只是「入场券」,如何真正在运行中把算力用起来,即「算力利用率」,才是核心难题。

周易 X3 NPU IP 发布会现场|图片来源:安谋科技

安谋科技 Arm China 给出了一组基于 Llama2 7B(70 亿参数)大模型的实测数据:「周易」X3 在 Prefill(处理提示词)阶段的算力利用率高达 72%。这是一个远超行业平均水平的数字,意味着 NPU 在处理用户输入时没有「出工不出力」。

更令人瞩目的是 Decode(生成 token)阶段的数据。安谋科技 Arm China 宣称,在自研解压硬件 WDC 的加持下,X3 实现了「Decode 阶段有效带宽利用率超 100%」。

「有效带宽超 100%」听起来有悖常理,但这背后是安谋科技 Arm China 解决端侧带宽瓶颈的「独门武器」。这个名为 WDC 的自研解压硬件 ,允许大模型的权重(Weights)以软件无损压缩的形式存储。在 NPU 运算需要调用这些权重时,WDC 硬件会实时进行解压。这一过程对软件透明,却能带来 15%~20% 的等效带宽提升。换言之,它让有限的物理带宽「跑」出了远超其物理限制的数据量,从而极大满足了大模型解码阶段对高吞吐量的渴求。

为了让云端大模型能高效迁移到端侧,「周易」X3 还在架构上集成了多项关键创新。它新增了 W4A8/W4A16(4 位权重、8/16 位激活)计算加速模式,这种低比特量化技术能大幅降低模型对带宽的消耗。同时,它提供了极其广泛的多精度融合计算支持,涵盖 int4, int8, int16, int32, fp4, fp8, fp16, bf16, fp32 等几乎所有主流数据类型,使其能灵活平衡性能与能效,适配从传统 CNN 到前沿大模型的各种需求。

此外,X3 还集成了一个 AI 专属硬件引擎 AIFF(AI Fixed-Function)和一个专用硬化调度器。在智能座舱或 ADAS 这类需要多任务并行和高优先级响应的场景中,这一设计至关重要。它能将 AI 任务调度对 CPU 的负载降低至 0.5% ,让宝贵的 CPU 资源去处理其他系统任务,同时确保高优先级 AI 任务(如碰撞预警)获得即时响应。

 

让 AI 开发从「好用」到「用好」

「周易」X3 不仅仅是一块高性能的硬件 IP,它还配套了一个名为「Compass AI」的软件平台。安谋科技 Arm China 产品总监鲍敏祺指出,X3 遵循「软硬协同、全周期服务与成就客户」的准则,旨在提供从硬件、软件到售后服务的全链路支持。

在 AI 落地过程中,软件开发的「适配难、周期长、门槛高」是长期存在的痛点。「Compass AI」平台的目标,就是通过「软硬一体」的协同设计,让开发者从「好用」进阶到「用好」。

「Compass AI」的软件平台|图片来源:安谋科技

该平台的核心是 NN Compiler(神经网络编译器)。它支持 TensorFlow、ONNX、PyTorch 等主流 AI 框架,兼容超过 160 种算子和 270 种模型。

对于当前火热的大模型生态,「Compass AI」平台提供了一个极具吸引力的功能:通过其 AIPULLM 工具链,可直接支持 Hugging Face 格式模型,实现「一站式」转化与部署。Hugging Face 是全球最大的 AI 模型集散地,这一功能意味着开发者可以极低门槛地将社区的前沿模型快速部署到「周易」X3 上。

该平台还具备先进的模型推理优化能力,包括业界领先的大模型动态 shape 支持(能高效处理任意长度的输入序列),并支持 GPTQ 等主流量化方案,以及对 LLM(大语言模型)、VLM(视觉语言模型)和 MoE(混合专家模型)的高性能支持。

更重要的是,安谋科技 Arm China 选择了「开放生态」路线。Compass 平台中的 Parser(模型解析)、Optimizer(优化器)、Linux Driver(驱动)等核心组件已相继开源。这为开发者提供了「白盒」部署的可能,他们可以利用丰富的调试工具和 Bit 精度软件仿真平台进行深度性能调优。有能力的客户甚至可以利用平台提供的工具和接口,开发自定义算子,乃至打造出「属于自己的模型编译器」,从而实现产品差异化。

这种「软硬协同」贯穿了 X3 的设计始终。例如 AIFF 模块,硬件团队通过增大总线带宽、增加 DMA(直接内存访问)的 outstanding 等方式提升数据搬运效率;软件团队则针对性设计专属使用模式,如对模型进行合理切分,以充分发挥多核并行优势。在系统兼容性上,Compass 平台也做到了全面覆盖,支持 Android、Linux、RTOS、QNX 等多种操作系统,并通过 TVM/ONNX 实现 SoC 异构计算。

 

从无形 IP 到 AI 万象

「周易」X3 的发布,清晰地勾勒出了安谋科技 Arm China 面向的四大核心领域:基础设施、智能汽车、移动终端和智能物联网。

在发布会现场的 demo 展示区,安谋科技 Arm China 展示了「周易」IP 家族的演进:从 Z1 赋能 AIoT 的人脸识别 ,到 Z2/Z3 进入入门级座舱和辅助驾驶 ,再到 X1/X2 运行自动泊车、Stable Diffusion 文生图。

安谋科技当天的 IP 应用展区|图片来源:安谋科技

而新旗舰「周易」X3 则全面展示了其作为「端侧大模型杀手」的实力,现场演示了运行 DeepSeek-R1-Distill-Qwen-1.5B 模型的流畅 AI 对话,以及运行 Stable Diffusion v1.5 的文生图和 MiniCPM v2.6 的多模态图文理解。

这一演进路径,清晰地表明端侧 AI 已从单一的功能感知,迈向了融合多种模型的「复杂认知」新阶段。

具体到应用中:

智能汽车领域: 这是 X3 的重点目标。它将同时赋能智能驾驶与智能座舱,在 ADAS 系统中为自动泊车等功能提供 AI 算力;在 IVI(车载信息娱乐系统)中,则支持基于语音和车内外视频的智能互动。

移动终端领域: 在 AI PC 和 AI 手机上,X3 可用于超分渲染(提升显示效果),并为基于大模型的 AI Agent 应用提供澎湃算力。

基础设施与物联网: 在加速卡、智能 IPC(网络摄像机)、智能网关等设备中,X3 的本地 AI 推理能力将带来更快的响应速度和更好的隐私保护。

「周易」X3 的发布,标志着安谋科技 Arm China「All in AI」产品战略的正式启动。在「AI Arm CHINA」的战略发展方向下,安谋科技 Arm China 正携手生态伙伴,试图加快构建国内「AI+」产业升级的智能计算基石,为千行百业的智能化转型提供更强的 IP「核芯」动力。

联系我们