# 英伟达GTC 2026深度解读(上篇):万亿订单背后,老黄在押注什么 > 发布日期:2026-03-17 > 分类:深度解读 / 行业趋势 > 作者:老邓唠AI ![封面 — GTC 2026 SAP Center 主题演讲场馆](https://cdn.union.jxyunge.com/self-media/005/gtc26-sap-center.jpg) ## 引子:老黄又演了 4 个小时 ![GTC 2026 预展现场](https://cdn.union.jxyunge.com/self-media/005/gtc26-preshow.jpg) 3月16日,圣何塞 SAP 中心。 黄仁勋站在台上,穿着他标志性的黑色皮衣,讲了整整 **4 个小时**。 台下是 2.5 万名来自全球的工程师、研究员和投资人。线上同步收看的超过 **30 万人**。 这不是一场普通的发布会。这是英伟达向全世界宣告:**AI 的基础设施战争,我们打算一直赢下去。** 演讲结束时,黄仁勋公布了一个数字——Blackwell 与 Vera Rubin 的累计采购订单,预计到 2027 年将突破 **1 万亿美元**。 老邓看完整场,整理了将近 20 页笔记。今天这篇,带你把 GTC 2026 真正看懂。 --- ## 一、主旋律:AI 进入"代理时代" 去年 GTC,黄仁勋提出 AI 发展三阶段:生成式 AI → 代理式 AI → 物理 AI。 今年的主旋律很清晰:**代理式 AI(Agentic AI)已经到来,物理 AI 开始落地。** ### 什么是代理式 AI? 以前的 AI 是"回答问题的工具"——你问它,它答你,完事。 代理式 AI 是"能独立做事的助理"——你给它目标,它能自己拆解任务、调用工具、多步推进、完成目标。 这听起来像 2024 年就在说的事,但黄仁勋的判断是:**真正的 Agentic AI 爆发,发生在推理算力大幅跃升之后。** 而推理算力的大幅跃升,正是今年 GTC 的核心议题。 --- ## 二、硬件路线图:芯片性能狂飙 900 倍 这是本次大会最硬核的部分,也是最值得细看的部分。 ### 2.1 Vera Rubin:今年下半年的主角 **Vera Rubin** 是 2026 年下半年量产的旗舰 GPU 平台,以天文学家维拉·鲁宾命名。 核心参数一览: ![Vera Rubin GPU 芯片](https://cdn.union.jxyunge.com/self-media/005/rubin-gpu.jpg) | 参数 | Vera Rubin GPU | |------|---------------| | 晶体管数量 | **3360 亿个**(双 reticle 拼接) | | 制程工艺 | TSMC 3nm | | 单卡推理性能 | **50 PFLOPS(NVFP4)** | | 单卡显存 | 288 GB HBM4 | | 内存带宽 | 22 TB/s | | 对比 Blackwell | 推理性能提升 **5 倍**,token 推理成本降低 **10 倍** | 搭配的 CPU 叫 **Vera**,88 核、基于 Arm v9.2-A 架构,自带 1.5 TB LPDDR5x 内存。 **最重要的不是单卡参数,而是机架级规格:** Vera Rubin NVL72 = 72 块 Rubin GPU + 36 块 Vera CPU,整机推理性能达到 **3.6 ExaFLOPS**。 ![Vera Rubin NVL72 七芯片机架全景](https://cdn.union.jxyunge.com/self-media/005/rubin-nvl72-rack.jpg) 功耗超过 250 kW,需要全液冷。黄仁勋特别强调了一个细节:机柜安装时间从 Blackwell 的 **2 小时缩短到 5 分钟**。这说明 NVIDIA 正在把数据中心变成"标准化工厂"。 ### 2.2 Rubin Ultra:2027 年的下一棒 | 时间 | 产品 | 推理性能 | 机架代号 | 功耗 | |------|------|---------|---------|------| | 2026 H2 | Vera Rubin NVL72 | 3.6 ExaFLOPS | — | 250 kW | | 2027 H2 | Rubin Ultra NVL576 | **10x Rubin** | Kyber | **600 kW** | | 2028 | Feynman | — | — | — | Rubin Ultra 单卡推理性能 100 PFLOPS FP4,搭配 1 TB HBM4e 显存,机架代号 "Kyber",装满 576 张卡,功耗高达 600 kW。 这个数字很夸张——600 kW 相当于一座小型变电站。**AI 数据中心正在变成能源消耗的怪兽。** ### 2.3 Feynman:2028 年的技术飞跃 以物理学家理查德·费曼命名的下一代架构,是本场演讲里最令人兴奋的展望: - 制程:**TSMC A16(1.6nm)**,这是目前已知最先进的工艺节点 - 首次引入 **硅光子技术**——用光信号代替电信号传输数据 - 首次采用 **3D Die Stacking**(三维堆叠) - 搭配新 CPU:**Rosa**(致敬 DNA 双螺旋发现者罗莎琳德·富兰克林) 相比 Blackwell,Feynman 的性能目标是提升约 **14 倍**。 这条路线图有个很有意思的命名规律:Vera Rubin(天文学家)、Feynman(物理学家)、Rosa(科学家)……NVIDIA 在用这些名字表达一种态度:**我们做的是改变世界的基础科学工作,不只是卖芯片。** --- ## 三、Groq 整合:花 200 亿买来推理加速器 这是本次大会最出乎意料的公告之一。 NVIDIA 以 **200 亿美元**收购了 Groq(绝大部分资产),并在 GTC 发布了集成产品 **Groq 3 LPU**: ![NVIDIA Groq 3 LPU](https://cdn.union.jxyunge.com/self-media/005/groq3-lpu.jpg) | 指标 | Groq LPX 机架 | |------|--------------| | 每机架 LPU 数量 | 256 颗 | | 内存带宽 | **150 TB/s** | | 相比 Rubin HBM4 带宽 | **近 7 倍** | | tokens/watt 提升 | **35 倍** | 这里要理解一个底层逻辑:**GPU 是训练和复杂推理的王者,但 LPU(语言处理单元)更适合高并发、低延迟的推理场景。** Groq 的 LPU 架构,用极大的内存带宽换取极快的 token 生成速度。NVIDIA 把它与 Vera Rubin 机架搭配部署,让 GPU 负责复杂计算,LPU 负责高频响应。 这是一步好棋。Groq 一直是英伟达推理端最有威胁的竞争者,**买掉它,一举消除威胁,同时补全了自己的产品线。** --- ## 四、软件平台:NemoClaw 与六大开放模型 硬件只是英伟达护城河的一半,另一半是软件生态。 ### 4.1 NemoClaw:企业级代理 AI 平台 黄仁勋发布了 **NemoClaw**——一个基于 OpenClaw 框架的开源企业代理 AI 平台。 这个命名不是巧合。**OpenClaw** 正是老邓之前介绍过的那个爆火开源 AI Agent 框架。NVIDIA 选择拥抱开源生态,而不是另起炉灶,这是非常聪明的策略。 NemoClaw 核心能力: - 自动发现并编排 OpenClaw Agent - 利用本地 RTX PRO 6000 Blackwell 工作站的 4000 TOPS 算力 - 包含 NVIDIA OpenShell 运行时 + Agent Toolkit ### 4.2 六大开放模型家族 这是本次 GTC 最容易被忽视但其实最重要的战略布局之一: ![全球机器人生态伙伴](https://cdn.union.jxyunge.com/self-media/005/robotics-ecosystem.jpg) | 模型家族 | 定位 | |---------|------| | **Nemotron** | 语言与推理(黄仁勋宣称 Nemotron 3 Ultra 将成全球最强基础模型) | | **Cosmos** | 世界模型 / 视觉生成(机器人训练数据合成) | | **Isaac GR00T** | 通用人形机器人基础模型 | | **Alpamayo** | 可操控自动驾驶模型 | | **BioNeMo** | 生物学与化学 | | **Earth-2** | 天气与气候预测 | 这六个模型,覆盖了 NVIDIA 认为"物理 AI"最核心的六个应用场景。每一个都是一个独立的万亿市场。 **NVIDIA 的战略已经很清晰:做整个 AI 堆栈的操作系统。** 从硅片到机架,从框架到模型,从工具到部署——你用 NVIDIA 的芯片,同时用 NVIDIA 的模型,跑在 NVIDIA 的平台上。 --- ## 五、机器人:物理 AI 正式出发 黄仁勋说,工业机器人是一个 **50 万亿美元**的市场。去年是 ppt,今年开始见真章。 ### 5.1 GR00T N2:能力翻倍的机器人大脑 上一代 GR00T N1 发布于 2025 年,今年迭代到 **GR00T N2**: - 任务完成率超领先 VLA 模型 **2 倍以上** - 支持更复杂的双臂协作和长链条任务 - 预计 **2026 年底**开始向合作伙伴出货 GR00T N2 的合作阵容非常豪华:1X、AGIBOT、Agility、Boston Dynamics、Figure、Hexagon Robotics、NEURA Robotics……可以说,几乎所有顶级人形机器人公司都在这个生态里。 ![NVIDIA Physical AI 合作伙伴全图](https://cdn.union.jxyunge.com/self-media/005/physical-ai-partners.jpg) ### 5.2 Cosmos 3:解决机器人训练数据稀缺问题 机器人训练最大的瓶颈是**数据**——真实世界数据采集极其昂贵,且难以覆盖长尾场景。 NVIDIA 的解法是:**把数据问题转化为算力问题。** 用 **Cosmos 3**(世界模型)合成高质量训练数据,在仿真环境中跑数百万次虚拟实验,再把经验迁移到真实机器人。 这个思路很优雅:**算力是 NVIDIA 最不缺的东西,所以这个解法对 NVIDIA 来说是"用长处补短处"。** --- ## 六、自动驾驶:大国车企集体入场 黄仁勋点名了四家新加入 NVIDIA DRIVE Hyperion 平台的汽车厂商: **比亚迪、现代、日产、吉利** ![现代/起亚与NVIDIA合作](https://cdn.union.jxyunge.com/self-media/005/hyundai-nvidia.jpg) 这是一个值得单独拎出来说的信号。 中国最大的新能源车企比亚迪选择了 NVIDIA 的自动驾驶平台,这意味着什么? 一方面,说明 NVIDIA 在自动驾驶算力领域的竞争优势无可替代;另一方面,在中美科技博弈加剧的背景下,这笔合作能否顺利落地,本身就是一个值得持续关注的变量。 此外,NVIDIA 与 **Uber** 达成合作,计划到 2028 年将基于 DRIVE Hyperion 的自动驾驶车队扩展至**四大洲 28 个城市**。 --- ## 七、老邓的三个判断 看完整场,老邓有三个判断想跟你分享: ### 判断一:NVIDIA 的护城河在加深,不是在变浅 很多人一直在问:英伟达的护城河还能守多久?AMD、英特尔、谷歌 TPU、自研芯片——威胁从四面八方涌来。 但 GTC 2026 告诉我,NVIDIA 的护城河逻辑正在从"GPU 性能领先"升级为"全栈生态锁定"。 你用 NVIDIA 的芯片,就会自然用 NVIDIA 的 CUDA。用了 CUDA,就会用 NeMo、Dynamo、Isaac 这些上层框架。用了框架,就会用 GR00T、Cosmos 这些开源模型。 **每一层都在为下一层建造壁垒。** 这不是一家芯片公司,这是一家 AI 基础设施公司。 ### 判断二:推理成本的暴跌,会催生意想不到的应用 Vera Rubin 相比 Blackwell,token 推理成本降低 **10 倍**。 成本降低 10 倍,不是原有应用变便宜 10 倍——而是**大量原本"太贵跑不起来"的应用,会突然变得可行。** 历史一再证明这个规律:存储成本降低 10 倍,催生了云计算;带宽成本降低 10 倍,催生了视频流媒体;推理成本降低 10 倍,会催生什么? 老邓的猜想:**永远在线的个人 AI 助理、实时翻译与理解、全时监控与安全分析**……这些今天还"太贵"的场景,明年可能就变成标配。 ### 判断三:物理 AI 的落地,比预期快也比预期难 黄仁勋说机器人市场是 50 万亿,这个数字没错。但落地需要的不只是更好的模型,还需要解决硬件可靠性、安全认证、商业模式等一系列非技术问题。 **技术准备好了,系统没准备好。** 这个鸿沟,不是再快一倍的 GPU 能填平的。 GR00T N2 预计年底出货,但从出货到大规模商用,还有很长的路要走。乐观一点估计:物理 AI 的真正爆发,可能要等 2027-2028 年。 --- ## 尾声:老黄在赌什么? 有人说,黄仁勋是这个时代最会讲故事的 CEO。 但看完 GTC 2026,老邓觉得,黄仁勋讲的不只是故事——他在系统性地下注。 下注代理 AI 取代传统软件,下注物理 AI 改造工业世界,下注推理成本的暴跌会催生万亿市场…… 每一笔下注,他都同时押上了芯片、软件、模型和生态——形成了别人很难复制的闭环。 **万亿订单背后,是一个把每一层都想清楚了的人,在有条不紊地执行一盘大棋。** 至于这盘棋最终下成什么样,我们拭目以待。 --- ## 参考资料 - [Keynote by NVIDIA CEO Jensen Huang | NVIDIA GTC San Jose 2026](https://www.nvidia.com/gtc/keynote/) - [Nvidia GTC 2026: CEO Jensen Huang keynote | CNBC](https://www.cnbc.com/2026/03/16/nvidia-gtc-2026-ceo-jensen-huang-keynote-blackwell-vera-rubin.html) - [NVIDIA GTC 2026: Live Updates | NVIDIA Blog](https://blogs.nvidia.com/blog/gtc-2026-news/) - [NVIDIA Vera Rubin NVL72 Detailed | VideoCardz](https://videocardz.com/newz/nvidia-vera-rubin-nvl72-detailed-72-gpus-36-cpus-260-tb-s-scale-up-bandwidth) - [Nvidia slaps Groq into new LPX racks | The Register](https://www.theregister.com/2026/03/16/nvidia_lpx_groq_3/) - [NVIDIA Releases New Physical AI Models | NVIDIA Newsroom](https://nvidianews.nvidia.com/news/nvidia-releases-new-physical-ai-models-as-global-partners-unveil-next-generation-robots) - [GTC 2026: Nvidia wants to swap robotics' data problem for a compute problem | The Decoder](https://the-decoder.com/gtc-2026-nvidia-wants-to-swap-robotics-data-problem-for-a-compute-problem/) - [黄仁勋GTC演讲万字拆解 | 澎湃新闻](https://m.thepaper.cn/newsDetail_forward_30438355) - [NVIDIA GTC 2026 官方网站](https://www.nvidia.cn/gtc/)