- 新增05号文章《英伟达GTC 2026深度解读(上篇):万亿订单背后,老黄在押注什么》 - 详细介绍GTC 2026大会硬件路线图包括Vera Rubin、Rubin Ultra和Feynman架构 - 分析NVIDIA收购Groq整合推理加速器的战略布局 - 解读NemoClaw企业级代理AI平台和六大开放模型家族 - 探讨机器人物理AI和自动驾驶业务发展规划 - 补充完善图片规范文档,明确七牛云OSS转存要求
13 KiB
英伟达GTC 2026深度解读(上篇):万亿订单背后,老黄在押注什么
发布日期:2026-03-17 分类:深度解读 / 行业趋势 作者:老邓唠AI
引子:老黄又演了 4 个小时
3月16日,圣何塞 SAP 中心。
黄仁勋站在台上,穿着他标志性的黑色皮衣,讲了整整 4 个小时。
台下是 2.5 万名来自全球的工程师、研究员和投资人。线上同步收看的超过 30 万人。
这不是一场普通的发布会。这是英伟达向全世界宣告:AI 的基础设施战争,我们打算一直赢下去。
演讲结束时,黄仁勋公布了一个数字——Blackwell 与 Vera Rubin 的累计采购订单,预计到 2027 年将突破 1 万亿美元。
老邓看完整场,整理了将近 20 页笔记。今天这篇,带你把 GTC 2026 真正看懂。
一、主旋律:AI 进入"代理时代"
去年 GTC,黄仁勋提出 AI 发展三阶段:生成式 AI → 代理式 AI → 物理 AI。
今年的主旋律很清晰:代理式 AI(Agentic AI)已经到来,物理 AI 开始落地。
什么是代理式 AI?
以前的 AI 是"回答问题的工具"——你问它,它答你,完事。
代理式 AI 是"能独立做事的助理"——你给它目标,它能自己拆解任务、调用工具、多步推进、完成目标。
这听起来像 2024 年就在说的事,但黄仁勋的判断是:真正的 Agentic AI 爆发,发生在推理算力大幅跃升之后。
而推理算力的大幅跃升,正是今年 GTC 的核心议题。
二、硬件路线图:芯片性能狂飙 900 倍
这是本次大会最硬核的部分,也是最值得细看的部分。
2.1 Vera Rubin:今年下半年的主角
Vera Rubin 是 2026 年下半年量产的旗舰 GPU 平台,以天文学家维拉·鲁宾命名。
核心参数一览:
| 参数 | Vera Rubin GPU |
|---|---|
| 晶体管数量 | 3360 亿个(双 reticle 拼接) |
| 制程工艺 | TSMC 3nm |
| 单卡推理性能 | 50 PFLOPS(NVFP4) |
| 单卡显存 | 288 GB HBM4 |
| 内存带宽 | 22 TB/s |
| 对比 Blackwell | 推理性能提升 5 倍,token 推理成本降低 10 倍 |
搭配的 CPU 叫 Vera,88 核、基于 Arm v9.2-A 架构,自带 1.5 TB LPDDR5x 内存。
最重要的不是单卡参数,而是机架级规格:
Vera Rubin NVL72 = 72 块 Rubin GPU + 36 块 Vera CPU,整机推理性能达到 3.6 ExaFLOPS。
功耗超过 250 kW,需要全液冷。黄仁勋特别强调了一个细节:机柜安装时间从 Blackwell 的 2 小时缩短到 5 分钟。这说明 NVIDIA 正在把数据中心变成"标准化工厂"。
2.2 Rubin Ultra:2027 年的下一棒
| 时间 | 产品 | 推理性能 | 机架代号 | 功耗 |
|---|---|---|---|---|
| 2026 H2 | Vera Rubin NVL72 | 3.6 ExaFLOPS | — | 250 kW |
| 2027 H2 | Rubin Ultra NVL576 | 10x Rubin | Kyber | 600 kW |
| 2028 | Feynman | — | — | — |
Rubin Ultra 单卡推理性能 100 PFLOPS FP4,搭配 1 TB HBM4e 显存,机架代号 "Kyber",装满 576 张卡,功耗高达 600 kW。
这个数字很夸张——600 kW 相当于一座小型变电站。AI 数据中心正在变成能源消耗的怪兽。
2.3 Feynman:2028 年的技术飞跃
以物理学家理查德·费曼命名的下一代架构,是本场演讲里最令人兴奋的展望:
- 制程:TSMC A16(1.6nm),这是目前已知最先进的工艺节点
- 首次引入 硅光子技术——用光信号代替电信号传输数据
- 首次采用 3D Die Stacking(三维堆叠)
- 搭配新 CPU:Rosa(致敬 DNA 双螺旋发现者罗莎琳德·富兰克林)
相比 Blackwell,Feynman 的性能目标是提升约 14 倍。
这条路线图有个很有意思的命名规律:Vera Rubin(天文学家)、Feynman(物理学家)、Rosa(科学家)……NVIDIA 在用这些名字表达一种态度:我们做的是改变世界的基础科学工作,不只是卖芯片。
三、Groq 整合:花 200 亿买来推理加速器
这是本次大会最出乎意料的公告之一。
NVIDIA 以 200 亿美元收购了 Groq(绝大部分资产),并在 GTC 发布了集成产品 Groq 3 LPU:
| 指标 | Groq LPX 机架 |
|---|---|
| 每机架 LPU 数量 | 256 颗 |
| 内存带宽 | 150 TB/s |
| 相比 Rubin HBM4 带宽 | 近 7 倍 |
| tokens/watt 提升 | 35 倍 |
这里要理解一个底层逻辑:GPU 是训练和复杂推理的王者,但 LPU(语言处理单元)更适合高并发、低延迟的推理场景。
Groq 的 LPU 架构,用极大的内存带宽换取极快的 token 生成速度。NVIDIA 把它与 Vera Rubin 机架搭配部署,让 GPU 负责复杂计算,LPU 负责高频响应。
这是一步好棋。Groq 一直是英伟达推理端最有威胁的竞争者,买掉它,一举消除威胁,同时补全了自己的产品线。
四、软件平台:NemoClaw 与六大开放模型
硬件只是英伟达护城河的一半,另一半是软件生态。
4.1 NemoClaw:企业级代理 AI 平台
黄仁勋发布了 NemoClaw——一个基于 OpenClaw 框架的开源企业代理 AI 平台。
这个命名不是巧合。OpenClaw 正是老邓之前介绍过的那个爆火开源 AI Agent 框架。NVIDIA 选择拥抱开源生态,而不是另起炉灶,这是非常聪明的策略。
NemoClaw 核心能力:
- 自动发现并编排 OpenClaw Agent
- 利用本地 RTX PRO 6000 Blackwell 工作站的 4000 TOPS 算力
- 包含 NVIDIA OpenShell 运行时 + Agent Toolkit
4.2 六大开放模型家族
这是本次 GTC 最容易被忽视但其实最重要的战略布局之一:
| 模型家族 | 定位 |
|---|---|
| Nemotron | 语言与推理(黄仁勋宣称 Nemotron 3 Ultra 将成全球最强基础模型) |
| Cosmos | 世界模型 / 视觉生成(机器人训练数据合成) |
| Isaac GR00T | 通用人形机器人基础模型 |
| Alpamayo | 可操控自动驾驶模型 |
| BioNeMo | 生物学与化学 |
| Earth-2 | 天气与气候预测 |
这六个模型,覆盖了 NVIDIA 认为"物理 AI"最核心的六个应用场景。每一个都是一个独立的万亿市场。
NVIDIA 的战略已经很清晰:做整个 AI 堆栈的操作系统。 从硅片到机架,从框架到模型,从工具到部署——你用 NVIDIA 的芯片,同时用 NVIDIA 的模型,跑在 NVIDIA 的平台上。
五、机器人:物理 AI 正式出发
黄仁勋说,工业机器人是一个 50 万亿美元的市场。去年是 ppt,今年开始见真章。
5.1 GR00T N2:能力翻倍的机器人大脑
上一代 GR00T N1 发布于 2025 年,今年迭代到 GR00T N2:
- 任务完成率超领先 VLA 模型 2 倍以上
- 支持更复杂的双臂协作和长链条任务
- 预计 2026 年底开始向合作伙伴出货
GR00T N2 的合作阵容非常豪华:1X、AGIBOT、Agility、Boston Dynamics、Figure、Hexagon Robotics、NEURA Robotics……可以说,几乎所有顶级人形机器人公司都在这个生态里。
5.2 Cosmos 3:解决机器人训练数据稀缺问题
机器人训练最大的瓶颈是数据——真实世界数据采集极其昂贵,且难以覆盖长尾场景。
NVIDIA 的解法是:把数据问题转化为算力问题。
用 Cosmos 3(世界模型)合成高质量训练数据,在仿真环境中跑数百万次虚拟实验,再把经验迁移到真实机器人。
这个思路很优雅:算力是 NVIDIA 最不缺的东西,所以这个解法对 NVIDIA 来说是"用长处补短处"。
六、自动驾驶:大国车企集体入场
黄仁勋点名了四家新加入 NVIDIA DRIVE Hyperion 平台的汽车厂商:
比亚迪、现代、日产、吉利
这是一个值得单独拎出来说的信号。
中国最大的新能源车企比亚迪选择了 NVIDIA 的自动驾驶平台,这意味着什么?
一方面,说明 NVIDIA 在自动驾驶算力领域的竞争优势无可替代;另一方面,在中美科技博弈加剧的背景下,这笔合作能否顺利落地,本身就是一个值得持续关注的变量。
此外,NVIDIA 与 Uber 达成合作,计划到 2028 年将基于 DRIVE Hyperion 的自动驾驶车队扩展至四大洲 28 个城市。
七、老邓的三个判断
看完整场,老邓有三个判断想跟你分享:
判断一:NVIDIA 的护城河在加深,不是在变浅
很多人一直在问:英伟达的护城河还能守多久?AMD、英特尔、谷歌 TPU、自研芯片——威胁从四面八方涌来。
但 GTC 2026 告诉我,NVIDIA 的护城河逻辑正在从"GPU 性能领先"升级为"全栈生态锁定"。
你用 NVIDIA 的芯片,就会自然用 NVIDIA 的 CUDA。用了 CUDA,就会用 NeMo、Dynamo、Isaac 这些上层框架。用了框架,就会用 GR00T、Cosmos 这些开源模型。
每一层都在为下一层建造壁垒。 这不是一家芯片公司,这是一家 AI 基础设施公司。
判断二:推理成本的暴跌,会催生意想不到的应用
Vera Rubin 相比 Blackwell,token 推理成本降低 10 倍。
成本降低 10 倍,不是原有应用变便宜 10 倍——而是大量原本"太贵跑不起来"的应用,会突然变得可行。
历史一再证明这个规律:存储成本降低 10 倍,催生了云计算;带宽成本降低 10 倍,催生了视频流媒体;推理成本降低 10 倍,会催生什么?
老邓的猜想:永远在线的个人 AI 助理、实时翻译与理解、全时监控与安全分析……这些今天还"太贵"的场景,明年可能就变成标配。
判断三:物理 AI 的落地,比预期快也比预期难
黄仁勋说机器人市场是 50 万亿,这个数字没错。但落地需要的不只是更好的模型,还需要解决硬件可靠性、安全认证、商业模式等一系列非技术问题。
技术准备好了,系统没准备好。 这个鸿沟,不是再快一倍的 GPU 能填平的。
GR00T N2 预计年底出货,但从出货到大规模商用,还有很长的路要走。乐观一点估计:物理 AI 的真正爆发,可能要等 2027-2028 年。
尾声:老黄在赌什么?
有人说,黄仁勋是这个时代最会讲故事的 CEO。
但看完 GTC 2026,老邓觉得,黄仁勋讲的不只是故事——他在系统性地下注。
下注代理 AI 取代传统软件,下注物理 AI 改造工业世界,下注推理成本的暴跌会催生万亿市场……
每一笔下注,他都同时押上了芯片、软件、模型和生态——形成了别人很难复制的闭环。
万亿订单背后,是一个把每一层都想清楚了的人,在有条不紊地执行一盘大棋。
至于这盘棋最终下成什么样,我们拭目以待。
参考资料
- Keynote by NVIDIA CEO Jensen Huang | NVIDIA GTC San Jose 2026
- Nvidia GTC 2026: CEO Jensen Huang keynote | CNBC
- NVIDIA GTC 2026: Live Updates | NVIDIA Blog
- NVIDIA Vera Rubin NVL72 Detailed | VideoCardz
- Nvidia slaps Groq into new LPX racks | The Register
- NVIDIA Releases New Physical AI Models | NVIDIA Newsroom
- GTC 2026: Nvidia wants to swap robotics' data problem for a compute problem | The Decoder
- 黄仁勋GTC演讲万字拆解 | 澎湃新闻
- NVIDIA GTC 2026 官方网站







