动态列表

  • GPT-5攻入数学圈,证明定理快过博士生?网友热议AI新角色
  • 阿里王牌Agent横扫SOTA,全栈开源力压OpenAI!博士级难题一键搞定
  • ChatGPT负责人深度复盘,爆4o复活内幕!过快下线是失误,将迭代模型人格
  • 全球首个AI基因组诞生,35亿年生命代码重编程!生物学迎「ChatGPT时刻」
  • 芯片大地震,黄仁勋355亿入股!英特尔要为老黄造CPU,股价狂飙30%
  • 科大讯飞发布面向东盟的多语言大模型及系列产品,布局中国—东盟AI生态大未来
  • Nature | 20年后你会患上哪些疾病?AI准确预测超1000种疾病患病风险,助力预防
  • 谁在拖慢你的RL?别怪显卡,错的可能是你的PG-loss
  • ICCV 2025 | Gap即力量!挖掘模态间隔潜力,MG-CLIP实现持续学习SOTA
  • 少样本不够看?给LLM装上“学习引擎”,上下文学习迈入千样本时代
  • 北京内推 | 字节跳动国际电商团队招聘大模型方向算法实习生
  • OneSearch,揭开快手电商搜索「一步到位」的秘技
  • 17.38 万的大六座 SUV,吉利用银河 M9 敲碎了友商的心
  • 刚刚,OpenAI在ICPC 2025编程赛上满分登顶,Gemini也达到金牌水平
  • 从一个公众号智能体说起:好用的Agent,究竟需要什么?
  • B站出海的强有力支柱:最新开源文本转语音模型IndexTTS-2.0标志零样本TTS进入双维度时代
  • 腾讯企点营销云发布Magic Agent,营销工具全面AI化
  • 带屏 AI 眼镜登场!Meta「眼镜全家桶」炸街了
  • 通义DeepResearch震撼发布!性能比肩OpenAI,模型、框架、方案完全开源
  • 让机器人「不只是走路」,Nav-R1引领带推理的导航新时代
  • 刚刚,DeepSeek-R1论文登上Nature封面,通讯作者梁文锋
  • 腾讯 AI 的新叙事
  • 传小米 YU7 新车型曝光纽北;李飞飞放出 3D AI 新成果; 49.2%,火山引擎大模型调用份额占半壁江山
  • 小扎豪掷143亿,却换不来AI燃料!数据之争下半场,中国冲出一匹黑马
  • 终结数据荒!智源开源首个Deep Research数据合成框架InfoSeek
  • 我用一张照片,生成了一个能走进去的世界
  • 奥特曼爆料:GPT-5重构彻底一切!一人顶五个团队
  • 最新实测GPT-5-Codex:前端能力碾压,复杂项目轻松搞定,Claude可以扔了!
  • TPAMI 2025 | 弱监督与自监督引领自动驾驶运动预测新范式,用场景分割“脑补”运动,仅需0.01%标注,性能媲美监督方法
  • 南开大学等提出RAM++:从关注“降质”到关注“内容”,实现鲁棒的全能图像恢复
  • 不改参数不重训!CARVE一招纠偏,对比注意力让视觉模型精准聚焦
  • ICML 2025 | AI福尔摩斯来了!LLaVA-ReID多轮发问,行人重识别一步步锁定
  • 博士申请 | 新加坡国立大学CoSTA Lab招收人工智能全奖博士/RA/实习生
  • 清华新作颠覆CoT!ParaThinker并行思考,终结单链推理天花板
  • 没想到,音频大模型开源最彻底的,居然是小红书
  • 6.1B打平40B Dense模型,蚂蚁开源最新MoE模型Ling-flash-2.0
  • 「AI助手」真来了?谷歌牵头推进Agent支付协议AP2
  • 腾讯AI Lab首创RL框架Parallel-R1,教大模型学会「并行思维」
  • 阿里开源通义DeepResearch,性能超OpenAI、DeepSeek旗舰模型
  • 华为发布4+10+N中小企业智能化方案,打通迈向智能世界「最后一公里」
  • LLM开源2.0大洗牌:60个出局,39个上桌,AI Coding疯魔,TensorFlow已死
  • Cell丨谷歌AI co-scientist联合帝国理工揭开谜团:提出并验证细菌基因转移机制假说
  • 华为首款旅行车 1 小时订单破 5000,余承东再次「封神」?
  • 腾讯、复旦、上海创智学院提出SwiftVideo:首个Continuous-time视频蒸馏加速框架,实现业界最快最高清视频生成
  • 刚刚,李飞飞空间智能新成果震撼问世!3D世界生成进入「无限探索」时代
  • 突破单链思考上限,清华团队提出原生「并行思考」scale范式
  • 刘强东喊话王兴:尊重兴哥,不应是仇人;美机器人公司估值暴涨至390亿美元;iOS 微信支持聊天发实况图|极客早知道
  • 7亿人每周狂发180亿条消息!OpenAI首次揭秘ChatGPT最火用途
  • LLM会梦到AI智能体吗?不,是睡着了也要加班
  • 一周休4天!老黄、盖茨站台,网友炸锅:是AI福利,还是裁员信号?
  • AI精神病爆发!沉迷ChatGPT把人「宠」出病,KCL心理学家实锤
  • 谷歌DeepMind「粪坑淘金」全新方法,暗网毒数据也能训出善良模型
  • 北京内推 | 微软Copilot算法团队招聘大模型推理方向研究型实习生
  • EMNLP 2025 | 跨风格不误判!MoSEs用职业写作风格建模,检测AI文本更稳更准
  • 一招打破瓶颈!HyperTree超树规划:AI掌握层级化推理,复杂任务全面突破
  • 高阶程序,让AI从技术可行到商业可信的最后一公里
  • 网络顶会获奖!华为提出端网协同RDMA传输架构,解决大规模AI集群网络可扩展性问题
  • 具身智能能力狂飙,安全却严重滞后?首个安全可信EAI框架与路线图出炉!
  • 在端侧 AI 时代正式到来之前,联想想先做好硬件「杀手锏」
  • 火山引擎发布PromptPilot,推动大模型应用高效落地
  • 在「外滩大会·具身智能:从泛化到行动,重塑产业未来」上,这些大牛都说了什么?
  • 国内首个!夸克公开覆盖全阶段医师考试的健康大模型测试集
  • 蚂蚁百灵开源轻量级MoE语言模型Ling-mini-2.0,1.4B激活性能比肩大规模模型
  • 浙大侯廷军团队联合IIT等发布系统综述:全景解析机器学习加持下的「增强采样」方法
  • BMVC 2025 | 无需源数据,Grad-CL如何利用梯度引导实现精准的眼底图像分割?
  • 斯坦福大学提出PSI:一种通过概率结构集成,从数据中学习可控、可灵活提示的世界模型的新系统
  • 谁说Scaling Law到头了?新研究:每一步的微小提升会带来指数级增长
  • 从少样本到千样本!MachineLearningLM给大模型上下文学习装上「机器学习引擎」
  • 最新披露,骑手收入真实情况揭晓
  • 刚刚,OpenAI发布GPT-5-Codex:可独立工作超7小时,还能审查、重构大型项目
  • 多模态BUG修复新SOTA:慕尼黑工大GUIRepair登上SWE-bench Multimodal榜单第一
  • 15年大佬深夜痛哭半小时!氛围编程巨坑曝光,95%程序员沦为「AI保姆」
  • 面试不是考试,是表演!新晋OpenAI员工:重磅揭秘顶级AI岗通关密码
  • GPT-5惨遭零分打脸,顶级AI全军覆没!奥特曼AI博士级能力神话破灭
  • 反转!LeCun刚转发「全球最快开源推理模型」,ETH苏黎世就直接打假
  • 新世界首富:斥巨资求永生,TikTok收购案最可能买家,得OpenAI千亿订单
  • 北京/杭州/西雅图内推 | 阿里通义实验室LLM Research团队招聘大模型研究科学家
  • 从Muon到AdaMuon:下一代优化器能否真正取代Adam?
  • EMNLP 2025 | LLM也会“装成人”?对比重写CoPA挑战AI文本检测可信度
  • 博士申请 | 南京大学范琦老师课题组招收26级/27级视频生成/世界模型方向博士生
  • 法天使与零一万物发布法务智能体平台,让AI成为法务部的超级员工
  • 从「对口型」到「会表演」,刚进化的可灵AI数字人,技术公开了
  • 数字生活的原生入口:蚂蚁集团发布AI眼镜全新技术框架gPass
  • OpenVision 2:大道至简的生成式预训练视觉编码器
  • 旗舰手机、AI 拍摄眼镜、Flyme ,魅族 22 「归航」终极生态
  • DeepMind与牛津大学提出LayerLock:用渐进式层冻结实现高效、无崩溃的自监督视觉表征学习
  • 超越GPT-4o,蚂蚁集团与南洋理工大学提出LaV-CoT:首个语言感知的视觉思维链
  • 为什么说现在所有的 AI Agent,都像 3D 打印机?|AI 上新
  • 召回率达99%,牛津大学等开发AI工具助天文学家快准识别超新星,从亿万星海中秒抓宇宙烟火
  • 用光学生成图像,几乎0耗电,浙大校友一作研究登Nature
  • 告别ROS的繁琐, 易用易学的机器人学习系统: 华为诺亚面向机器人学习的开源Python框架
  • 现货来了!火出圈!钉钉首款AI硬件DingTalk A1正式开售
  • 苹果 iOS 26 今日发布,8 大更新;华为小米宇树入选 MIT「聪明公司 50」;中国核电催更《流浪地球 3》
  • 2027万亿视频市场将爆发!AI十年如何重塑内容产业?|新智元十周年峰会
  • GPT-5是口袋博士?诺奖得主哈萨比斯怒怼奥特曼:博士级AI纯属扯淡!
  • 微软用「光」跑AI登上Nature!100倍能效颠覆GPU,华人首席研究员扛鼎
  • 缺钱但不缺洞见:刚刚,陶哲轩揭秘AI如何吞噬数学项目的灵魂!
  • 马斯克深夜挥刀,Grok幕后员工1/3失业!谷歌AI靠人肉堆起,血汗工厂曝光
  • 全景呈现大模型开源技术路线和生态,蚂蚁开源在2025外滩大会发布全新报告
  • 抢先实测美团首个AI Agent,让我体验一把「懒人点餐」的快乐
  • 将KV Cache预算降至1.5%!他们用进化算法把大模型内存占用砍下来了
  • LLaSO 横空出世:逻辑智能推出全球首个完全开源语音大模型框架,定义 LSLM 研究新基准
  • 为这一个Tab键,我愿意单独付费:Cursor用在线强化学习优化代码建议,护城河有了?
  • 小红书智创音频技术团队:SOTA对话生成模型FireRedTTS-2来了,轻松做出AI播客!
  • 大模型碰到真难题了,测了500道,o3 Pro仅通过15%
  • 耗资15000个A100 GPU日!港中文、阿里等发布600万规模T2I推理数据集与基准
  • INFFUS 25 | FS-Diff:一步到位,用扩散模型同时实现多模态图像融合与超分辨率
  • 神经细胞自动机实现目标导向的形态生成,AI在「生命游戏」里玩出反向规则
  • iPhone 17 全系上线拼多多,5099 起;「罗西大战」后续,传「预制菜国标」过审;小米蔚来小鹏抵制「车圈黑公关」
  • 突发!苹果AI大失血:Siri前掌门离职,核心团队被挖角,新功能延期到2026
  • 对Transformer说不!清华刘嘉:2045数字永生降临|新智元十年峰会
  • 急诊室生死逆转!酒后呕吐,GPT-5一眼锁定食管穿孔
  • 周周996,顿顿预制餐!美国AI界00后卷疯了: 住「棺材房」一周工作92小时
  • 学历越高,越怕熬夜!2.3万人10年研究实锤:睡得越晚,智力下降越快
  • Arm拥抱AI:五倍性能,三倍能效
  • Meta开源MobileLLM-R1模型,不到1B参数,用1/10的训练就超越了Qwen3
  • 清华、上海AI Lab等顶级团队发布推理模型RL超全综述,探索通往超级智能之路
  • 快手可灵团队提出MIDAS:压缩比64倍、延迟低于500ms,多模态互动数字人框架实现交互生成新突破
  • 成本不足60美元!开源U-ARM:让机器人模仿学习更亲民的通用遥操作界面
  • 让机器人“大脑”更轻更快:SQAP-VLA首次实现VLA模型量化与剪枝协同加速
  • 数据与AI双引擎驱动智能未来,2025外滩大会论数据进化之道
  • iPhone 17 Air 在华发售延期;罗永浩直播回应西贝;《流浪地球》第三部剧本完稿,共计十五万字|极客早知道
  • 刚刚,谷歌发布71页AI科研报告!6大领域全面超越专家,几小时顶几个月
  • 一夜刷屏!27岁姚顺雨离职OpenAI,清华姚班天才转型做产品经理?
  • 王小川押注下个十年:为人类造医生,为生命建模型|新智元十周年峰会
  • 一刀砍掉90%训练成本!Qwen3-Next用1/10算力练成「长文推理利器」
  • AI意识「觉醒」!图灵得主Bengio重磅发声:AI正接近人类意识临界点
  • 扩散语言模型也有MoE版本了!蚂蚁&人大从头训练LLaDA-MoE,即将完全开源
  • 如何为LLM智能体编写工具?Anthropic官方教程来了
  • 腾讯优图重磅开源Youtu-GraphRAG,实现图检索增强技术新突破
  • 「做笔记」的RAG来了!告别噪声与骨牌效应,EviNote-RAG稳住长链推理
  • KDD 2025最佳论文亚军:参数不同还能共训?异构知识迁移框架HtFLlib全面开源
  • Adam的Update RMS为何总是0.2?噪声模拟到理论近似全讲透
  • 北京/上海内推 | 小红书智能审核算法团队招聘NLP/多模态内容理解算法工程师/实习生
  • 我苦寻的「库乐队」,叫 MiniMax Music 1.5
  • Science Advances | AI for Earth:聆听海洋的「脉搏」,新一代AI大模型精准预测十年气候脉动
  • 外滩大会嘉宾锐评AGI即将“撞墙”,正在向数字与物理世界进化
  • 港科大 X MiniMax:高质量数据、小模型挑战复杂网络搜索难题
  • 为了网罗 AI 创新者,上海搞了场万人科创大赛
  • 蚂蚁集团数字蚂力首批专家级“AI数字员工团队”亮相外滩大会
  • “IIFAA数字卡包”上线支付宝:目前已支持多类身份申领
  • 蚂蚁集团加码AGI等青年人才培育,2025蚂蚁InTech奖在外滩大会揭晓
  • 重塑药物研发,哈佛医学院等开源全新AI模型,用「图神经网络」破解疾病驱动因素多元难题
  • 全球最懂智能体的创业者齐聚外滩大会,未来三年怎么做聊透了
  • 马上上岛|云栖大会「新世代 AI 创想岛」即将揭幕
  • ICRA 2025 | TANGO:机器人告别3D地图,仅靠RGB摄像头实现零样本长距离导航
  • 挑战主流认知!蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型
  • 姚顺雨离职OpenAI,「亿元入职腾讯」传闻引爆AI圈,鹅厂辟谣了
  • 全新MoE架构!阿里开源Qwen3-Next,训练成本直降9成
  • 告别错误累计与噪声干扰,EviNote-RAG 开启 RAG 新范式
  • 西贝贾国龙称一定起诉罗永浩;支付宝推出「AI 付」服务;iPhone 17 京东、天猫预订量比上代大增|极客早知道

我们还是低估了英伟达

作者|芯芯 

编辑|靖宇

即便市值已经突破 4 万亿美元,我们还是低估了英伟达,大大的低估了。

在不少人的印象中,英伟达依然是那个「核弹厂」。其实,在 AI 急需的芯片之外,英伟达始终有一个云平台的野心。

2023 年,英伟达的 DGX Cloud 高调登场,一台实例配备八块 H100,月租 36999 美元,定价直达天花板,也被外界视作英伟达挑战 AWS、Azure 这些老牌云厂商的信号。

然而,2025 年中,这个「亲儿子」却悄然退出 C 位。英伟达不再将其数十亿美元的云支出承诺对齐 DGX Cloud, 其角色转向内部基础设施与研发用途,而非面向企业市场的主打产品

取而代之的, 是 2025 年新上线的 Lepton —— 一个 GPU 租赁与调度的市场型产品 。从定义来看,新的 Lepton 是一个算力管理和分发平台,更像是一个算力需求的「入口」。

DGX Cloud 为什么退场?Lepton,能不能接承接住英伟达在 AI 时代成为云计算霸主的野心?

01 

以退为进

很多人或许都还记得 2023 年的「GPU 荒」,企业即便有钱,也往往买不到 H100。于是英伟达顺势推出了 DGX Cloud,把自有的高端算力集群「按月出租」,企业开通即用。

在推出的第一年,DGX Cloud 的确收获了热度。到 2024 年底,英伟达的财报显示其软件与服务收入(包括 DGX Cloud)达到了 20 亿美元的年化水平。

然而,转折点出现在 2024 年下半年后,随着 GPU 供应逐渐缓解,亚马逊、微软、谷歌等云厂商纷纷「砍价」,DGX Cloud 的优势随之消散。以亚马逊的 AWS 为例,其对 H100 和 A100 实例降价幅度高达 45%,远低于 DGX Cloud 的租赁价格。

对客户而言,DGX Cloud 的紧缺溢价很快失去立足点。

英伟达在 2023 年 3 月推出 DGX Cloud|图片来源:GTC 2023

更现实的问题还在于「渠道冲突」

亚马逊、微软和谷歌是英伟达最大的芯片买家,对英伟达的营收构成了极大支撑。DGX Cloud 的直接客户模式意味着英伟达和这些合作伙伴抢生意。每一份 DGX Cloud 合同,都有可能挤压 AWS、Azure 或 GCP 的收入。

买家的担心是可预期的,更长远的后果,是推着这些伙伴加码自研芯片,如 AWS 的 Trainium、谷歌的 TPU,以降低对英伟达的结构性依赖。

而且短时间内,建立起稳定的客户黏性也是挑战,有些企业会把 DGX Cloud 当作临时方案,在产能紧绷、项目启动急的窗口期租上几个月,随后再迁回长期合作的 AWS、Azure 或谷歌云。

英伟达黄仁勋与谷歌云高管同台|图片来源:英伟达

考虑到这些,到最新的财年,英伟达的财务披露中不再将巨额的云支出承诺归于 DGX Cloud,这项服务仍然列在收入类别中,但其角色已明显转向内22部基础设施。换句话说, DGX Cloud 仍然存在,但它逐渐退回英伟达内部,不再打算与微软、亚马逊、谷歌等公司正面竞争

除了选择把 DGX Cloud「转为内用」,英伟达还把外部注意力引向一个新的平台化入口:

Lepton。

英伟达在 2025 年 5 月推出这个新平台,也在 DGX Cloud 体系名下,但不同于 DGX Cloud 那种把「英伟达自己的 AI 芯片直接租给客户」的模式, Lepton 完全不碰 GPU 库存,它只是负责「把需求导向合适的云服务商」,包括 AWS、Azure,也包括英伟达自己一手扶持的云服务商

「Lepton 会将我们的全球 GPU 云提供商网络与 AI 开发者连接起来。」英伟达创始人兼 CEO 黄仁勋在发布 Lepton 时称,目标是:

「打造一个全球规模的 AI 工厂」

简而言之,为了不缓解和渠道的竞争,英伟达的策略重点已经不再是一个「英伟达云」。

02 

Nvidia「朋友圈」

但 DGX Cloud 角色的淡出并不意味着英伟达放弃了云。在过去两年里,英伟达一直在扶持自己的云服务商「小弟」。而且还出现过让人觉得匪夷所思的一幕——英伟达一边把 GPU 卖给云伙伴,一边又从这些伙伴那租回算力。

以 CoreWeave 为例,英伟达不仅在 2023 年投资了 CoreWeave 1 亿美元,还向其优先供货 H100 GPU。在供需紧张时期,这让 CoreWeave 成为少数能大规模提供英伟达 GPU 的云服务商。而英伟达自己又回过头来,从 CoreWeave 租用这些 GPU。

CoreWeave 承接 AI 东风顺利上市|图片来源:网络

Lambda 也类似,这是一家规模小得多的 GPU 云服务提供商。2025 年 9 月,英伟达与 Lambda 签订了一份价值 15 亿美元的租赁协议,租期为四年,其中包括租回 1 万台搭载自家顶级 GPU 服务器,总价值约 13 亿美元。这个交易让英伟达成为 Lambda 最大的客户,而英伟达自己的研发团队将使用这些 GPU 训练模型。

Lambda 也是英伟达生态圈的一员|图片来源:网络

具体来说,英伟达先通过销售芯片获得即时收入,让财报好看、股东满意;合作伙伴则依靠出租 GPU 获得稳定现金流,从而扩大规模;随后英伟达再以租赁的方式把算力锁定在自己手中,确保关键时刻不会断供。此外,这和普通公司选择租用云服务而不是自建机房的逻辑是一样的,可以更灵活地应对研发波峰和波谷。

这个操作的精妙之处在于,芯片卖出的那一刻,收入立刻计入英伟达账面,支出则后置,租金在未来几年慢慢摊销,转化为运营成本。与此同时,英伟达无需自建数据中心,资产压力最小化。

对合作伙伴来说,英伟达成了最大甲方,算力与现金流被绑定,强化了其生态黏性。更微妙的是,这种操作还能稳定市场心理。当连英伟达都愿意以这个价格回租, 便相当于为 AI 算力 行情做了一次背书,锚定了价格预期,最终变成一石三鸟

这套玩法复制到了各种英伟达系云计算初创公司中:卖芯片-投资客户-租回服务-再次卖芯片,最终变成一个自循环的 AI 芯片生态资金链。

与此同时,英伟达还通过旗下专门的风险投资部门 Nventures,在更广阔的 AI 生态下注。它投资了很多初创公司,从模型开发,到应用层的初创企业。虽然这些公司并非都做云服务,但逻辑是一致的:通过投资绑定潜在客户和未来生态,只要这些初创公司成长壮大,它们的算力需求最终都会转化为对英伟达芯片的采购。

可以说, 英伟达不仅仅是在卖芯片,它就像是在经营一个庞大的 AI 创业孵化器,来打造一套「英伟达系」云生态

03

AI 算力的「App Store」

说回 Lepton,它与英伟达「卖一手、租一手」的本质有一点相似,就是给算力「做市」。

与 DGX Cloud 直接对客户不同, Lepton 并不亲自经营云服务,而是作为「流量调度者」,把客户的任务分发给生态合作伙伴的数据中心

它本质上是一个算力市场,用户只需在 Lepton 平台提交需求,Lepton 会自动匹配到可用的 H100 或 Blackwell GPU,无论这些硬件位于 CoreWeave、Lambda,还是 AWS、Azure 的机房。

英伟达 Lepton 平台界面|图片来源:英伟达

而且,Lepton 将所有 GPU 云资源整合到英伟达的软件栈之下,比如 NIM 微服务和 NeMo 框架。开发者无需关心背后的提供商,只需通过 Lepton 平台即可获得一致的开发体验和环境。

更关键的是, Lepton 化解了英伟达与云巨头的冲突 。在这种模式下,英伟达不再是 AWS、Azure 的直接竞争对手,而是中立的调度平台。AWS 和微软也加入了 Lepton,原因很简单,通过这个市场,它们能够接触到额外的算力需求。

对于英伟达来说,与合作伙伴对抗的风险太大,远不如退到幕后,转而做算力市场的调度者和掌控者。这是典型的「退一步,海阔天空」,不再冒犯合作伙伴,反而继续掌控生态入口,不论客户选择哪家云,最终都离不开英伟达的 GPU 和软件栈。

于是,放弃构建自己的云服务就不是软弱的表现,Lepton 对英伟达来说是一个鱼与熊掌兼得的策略。

英伟达 Lepton 平台界面|图片来源:英伟达

当然,Lepton 的推广也非一帆风顺。一些中小型云厂商担心英伟达借此插足客户关系,或影响定价,它并非一夜之间就能改变游戏规则。但当 AWS 和 Azure 都进入市场后,Lepton 的存在无法忽视。未来 AI 算力的跨云调度,有可能会通过某个平台来完成。

对开发者来说, 「在哪里算」变得次要 ; 能不能算、多久能算、成本如何才是核心,而这些正是 Lepton 试图统一的体验层

英伟达不再需要自建一个「英伟达云」,也不必在 IaaS 层与伙伴正面相撞,它想做的是把所有玩家拉入自己的体系,让所有云使用英伟达的 GPU、调用英伟达的框架、通过英伟达的入口完成采购与调度。

如果顺利,它看似只是一个 GPU 聚合市场,实则可以成为算力世界的控制面板。谁接到单子,谁活得下去,分配权掌握在英伟达手中。更长线的收益是数据与感知, Lepton 在跨云调度过程中天然能观察到哪类任务最活跃、哪些地域更紧张、哪一代 GPU 使用更频繁、价格弹性如何,反过来辅助商业决策

就像苹果通过 App Store 掌控了移动互联网,英伟达想用 Lepton 做到同样的事,只是对象从 App 换成了算力。

英伟达 Lepton 平台连接各种云服务|图片来源:英伟达

这也解释了英伟达当下的市场逻辑。简言之,它并不需要拥有云,它只需要拥有算力栈和需求入口。只要全球 AI 训练与推理仍以其 GPU 为核心,无论算力最终落在亚马逊 AWS、微软 Azure、谷歌 GCP,还是 CoreWeave、Lambda,无论客户选择谁,只要掌控价值链,英伟达都能获得价值。

从 AI 芯片,到 DGX Cloud,再到现在的 Lepton,英伟达的计划早已经从硬件过渡到「算力」和「平台」的阶段——任何一家公司市值突破 4 万亿美元、其产品已经成为 AI 时代重要生产资料的公司,都不可能没有更大的野心,不是吗?

联系我们