feat(article): 添加英伟达GTC 2026深度解读文章
- 新增05号文章《英伟达GTC 2026深度解读(上篇):万亿订单背后,老黄在押注什么》 - 详细介绍GTC 2026大会硬件路线图包括Vera Rubin、Rubin Ultra和Feynman架构 - 分析NVIDIA收购Groq整合推理加速器的战略布局 - 解读NemoClaw企业级代理AI平台和六大开放模型家族 - 探讨机器人物理AI和自动驾驶业务发展规划 - 补充完善图片规范文档,明确七牛云OSS转存要求
This commit is contained in:
parent
52ee025c75
commit
887595784c
@ -10,3 +10,11 @@
|
||||
- 存放已发布的历史文章
|
||||
- 命名规则:`{编号}-{文章标题}.md`,如 `001-标题.md`、`002-标题.md`
|
||||
- 每篇文章有对应的同编号目录存放素材,如 `001/`、`002/`
|
||||
|
||||
# 图片规范
|
||||
|
||||
- 文章中所有图片(包括从外部抓取的官方图片)必须先转存到七牛云 OSS,再替换为七牛 CDN 链接
|
||||
- 七牛 CDN 域名:`https://cdn.union.jxyunge.com/self-media/`
|
||||
- 图片存放路径规则:`{编号}/{文件名}`,如 `005/cover.jpg`、`005/rubin-gpu.jpg`
|
||||
- 禁止在正式文章中直接引用第三方图片链接(外链不稳定,可能失效)
|
||||
- 使用 `/upload-qiniu` 工具上传图片到七牛
|
||||
|
||||
269
articles/005-英伟达GTC 2026深度解读(上篇):万亿订单背后,老黄在押注什么.md
Normal file
269
articles/005-英伟达GTC 2026深度解读(上篇):万亿订单背后,老黄在押注什么.md
Normal file
@ -0,0 +1,269 @@
|
||||
# 英伟达GTC 2026深度解读(上篇):万亿订单背后,老黄在押注什么
|
||||
|
||||
> 发布日期:2026-03-17
|
||||
> 分类:深度解读 / 行业趋势
|
||||
> 作者:老邓唠AI
|
||||
|
||||

|
||||
|
||||
## 引子:老黄又演了 4 个小时
|
||||
|
||||

|
||||
|
||||
3月16日,圣何塞 SAP 中心。
|
||||
|
||||
黄仁勋站在台上,穿着他标志性的黑色皮衣,讲了整整 **4 个小时**。
|
||||
|
||||
台下是 2.5 万名来自全球的工程师、研究员和投资人。线上同步收看的超过 **30 万人**。
|
||||
|
||||
这不是一场普通的发布会。这是英伟达向全世界宣告:**AI 的基础设施战争,我们打算一直赢下去。**
|
||||
|
||||
演讲结束时,黄仁勋公布了一个数字——Blackwell 与 Vera Rubin 的累计采购订单,预计到 2027 年将突破 **1 万亿美元**。
|
||||
|
||||
老邓看完整场,整理了将近 20 页笔记。今天这篇,带你把 GTC 2026 真正看懂。
|
||||
|
||||
---
|
||||
|
||||
## 一、主旋律:AI 进入"代理时代"
|
||||
|
||||
去年 GTC,黄仁勋提出 AI 发展三阶段:生成式 AI → 代理式 AI → 物理 AI。
|
||||
|
||||
今年的主旋律很清晰:**代理式 AI(Agentic AI)已经到来,物理 AI 开始落地。**
|
||||
|
||||
### 什么是代理式 AI?
|
||||
|
||||
以前的 AI 是"回答问题的工具"——你问它,它答你,完事。
|
||||
|
||||
代理式 AI 是"能独立做事的助理"——你给它目标,它能自己拆解任务、调用工具、多步推进、完成目标。
|
||||
|
||||
这听起来像 2024 年就在说的事,但黄仁勋的判断是:**真正的 Agentic AI 爆发,发生在推理算力大幅跃升之后。**
|
||||
|
||||
而推理算力的大幅跃升,正是今年 GTC 的核心议题。
|
||||
|
||||
---
|
||||
|
||||
## 二、硬件路线图:芯片性能狂飙 900 倍
|
||||
|
||||
这是本次大会最硬核的部分,也是最值得细看的部分。
|
||||
|
||||
### 2.1 Vera Rubin:今年下半年的主角
|
||||
|
||||
**Vera Rubin** 是 2026 年下半年量产的旗舰 GPU 平台,以天文学家维拉·鲁宾命名。
|
||||
|
||||
核心参数一览:
|
||||
|
||||

|
||||
|
||||
| 参数 | Vera Rubin GPU |
|
||||
|------|---------------|
|
||||
| 晶体管数量 | **3360 亿个**(双 reticle 拼接) |
|
||||
| 制程工艺 | TSMC 3nm |
|
||||
| 单卡推理性能 | **50 PFLOPS(NVFP4)** |
|
||||
| 单卡显存 | 288 GB HBM4 |
|
||||
| 内存带宽 | 22 TB/s |
|
||||
| 对比 Blackwell | 推理性能提升 **5 倍**,token 推理成本降低 **10 倍** |
|
||||
|
||||
搭配的 CPU 叫 **Vera**,88 核、基于 Arm v9.2-A 架构,自带 1.5 TB LPDDR5x 内存。
|
||||
|
||||
**最重要的不是单卡参数,而是机架级规格:**
|
||||
|
||||
Vera Rubin NVL72 = 72 块 Rubin GPU + 36 块 Vera CPU,整机推理性能达到 **3.6 ExaFLOPS**。
|
||||
|
||||

|
||||
|
||||
功耗超过 250 kW,需要全液冷。黄仁勋特别强调了一个细节:机柜安装时间从 Blackwell 的 **2 小时缩短到 5 分钟**。这说明 NVIDIA 正在把数据中心变成"标准化工厂"。
|
||||
|
||||
### 2.2 Rubin Ultra:2027 年的下一棒
|
||||
|
||||
| 时间 | 产品 | 推理性能 | 机架代号 | 功耗 |
|
||||
|------|------|---------|---------|------|
|
||||
| 2026 H2 | Vera Rubin NVL72 | 3.6 ExaFLOPS | — | 250 kW |
|
||||
| 2027 H2 | Rubin Ultra NVL576 | **10x Rubin** | Kyber | **600 kW** |
|
||||
| 2028 | Feynman | — | — | — |
|
||||
|
||||
Rubin Ultra 单卡推理性能 100 PFLOPS FP4,搭配 1 TB HBM4e 显存,机架代号 "Kyber",装满 576 张卡,功耗高达 600 kW。
|
||||
|
||||
这个数字很夸张——600 kW 相当于一座小型变电站。**AI 数据中心正在变成能源消耗的怪兽。**
|
||||
|
||||
### 2.3 Feynman:2028 年的技术飞跃
|
||||
|
||||
以物理学家理查德·费曼命名的下一代架构,是本场演讲里最令人兴奋的展望:
|
||||
|
||||
- 制程:**TSMC A16(1.6nm)**,这是目前已知最先进的工艺节点
|
||||
- 首次引入 **硅光子技术**——用光信号代替电信号传输数据
|
||||
- 首次采用 **3D Die Stacking**(三维堆叠)
|
||||
- 搭配新 CPU:**Rosa**(致敬 DNA 双螺旋发现者罗莎琳德·富兰克林)
|
||||
|
||||
相比 Blackwell,Feynman 的性能目标是提升约 **14 倍**。
|
||||
|
||||
这条路线图有个很有意思的命名规律:Vera Rubin(天文学家)、Feynman(物理学家)、Rosa(科学家)……NVIDIA 在用这些名字表达一种态度:**我们做的是改变世界的基础科学工作,不只是卖芯片。**
|
||||
|
||||
---
|
||||
|
||||
## 三、Groq 整合:花 200 亿买来推理加速器
|
||||
|
||||
这是本次大会最出乎意料的公告之一。
|
||||
|
||||
NVIDIA 以 **200 亿美元**收购了 Groq(绝大部分资产),并在 GTC 发布了集成产品 **Groq 3 LPU**:
|
||||
|
||||

|
||||
|
||||
|
||||
| 指标 | Groq LPX 机架 |
|
||||
|------|--------------|
|
||||
| 每机架 LPU 数量 | 256 颗 |
|
||||
| 内存带宽 | **150 TB/s** |
|
||||
| 相比 Rubin HBM4 带宽 | **近 7 倍** |
|
||||
| tokens/watt 提升 | **35 倍** |
|
||||
|
||||
这里要理解一个底层逻辑:**GPU 是训练和复杂推理的王者,但 LPU(语言处理单元)更适合高并发、低延迟的推理场景。**
|
||||
|
||||
Groq 的 LPU 架构,用极大的内存带宽换取极快的 token 生成速度。NVIDIA 把它与 Vera Rubin 机架搭配部署,让 GPU 负责复杂计算,LPU 负责高频响应。
|
||||
|
||||
这是一步好棋。Groq 一直是英伟达推理端最有威胁的竞争者,**买掉它,一举消除威胁,同时补全了自己的产品线。**
|
||||
|
||||
---
|
||||
|
||||
## 四、软件平台:NemoClaw 与六大开放模型
|
||||
|
||||
硬件只是英伟达护城河的一半,另一半是软件生态。
|
||||
|
||||
### 4.1 NemoClaw:企业级代理 AI 平台
|
||||
|
||||
黄仁勋发布了 **NemoClaw**——一个基于 OpenClaw 框架的开源企业代理 AI 平台。
|
||||
|
||||
这个命名不是巧合。**OpenClaw** 正是老邓之前介绍过的那个爆火开源 AI Agent 框架。NVIDIA 选择拥抱开源生态,而不是另起炉灶,这是非常聪明的策略。
|
||||
|
||||
NemoClaw 核心能力:
|
||||
- 自动发现并编排 OpenClaw Agent
|
||||
- 利用本地 RTX PRO 6000 Blackwell 工作站的 4000 TOPS 算力
|
||||
- 包含 NVIDIA OpenShell 运行时 + Agent Toolkit
|
||||
|
||||
### 4.2 六大开放模型家族
|
||||
|
||||
这是本次 GTC 最容易被忽视但其实最重要的战略布局之一:
|
||||
|
||||

|
||||
|
||||
| 模型家族 | 定位 |
|
||||
|---------|------|
|
||||
| **Nemotron** | 语言与推理(黄仁勋宣称 Nemotron 3 Ultra 将成全球最强基础模型) |
|
||||
| **Cosmos** | 世界模型 / 视觉生成(机器人训练数据合成) |
|
||||
| **Isaac GR00T** | 通用人形机器人基础模型 |
|
||||
| **Alpamayo** | 可操控自动驾驶模型 |
|
||||
| **BioNeMo** | 生物学与化学 |
|
||||
| **Earth-2** | 天气与气候预测 |
|
||||
|
||||
这六个模型,覆盖了 NVIDIA 认为"物理 AI"最核心的六个应用场景。每一个都是一个独立的万亿市场。
|
||||
|
||||
**NVIDIA 的战略已经很清晰:做整个 AI 堆栈的操作系统。** 从硅片到机架,从框架到模型,从工具到部署——你用 NVIDIA 的芯片,同时用 NVIDIA 的模型,跑在 NVIDIA 的平台上。
|
||||
|
||||
---
|
||||
|
||||
## 五、机器人:物理 AI 正式出发
|
||||
|
||||
黄仁勋说,工业机器人是一个 **50 万亿美元**的市场。去年是 ppt,今年开始见真章。
|
||||
|
||||
### 5.1 GR00T N2:能力翻倍的机器人大脑
|
||||
|
||||
上一代 GR00T N1 发布于 2025 年,今年迭代到 **GR00T N2**:
|
||||
|
||||
- 任务完成率超领先 VLA 模型 **2 倍以上**
|
||||
- 支持更复杂的双臂协作和长链条任务
|
||||
- 预计 **2026 年底**开始向合作伙伴出货
|
||||
|
||||
GR00T N2 的合作阵容非常豪华:1X、AGIBOT、Agility、Boston Dynamics、Figure、Hexagon Robotics、NEURA Robotics……可以说,几乎所有顶级人形机器人公司都在这个生态里。
|
||||
|
||||

|
||||
|
||||
### 5.2 Cosmos 3:解决机器人训练数据稀缺问题
|
||||
|
||||
机器人训练最大的瓶颈是**数据**——真实世界数据采集极其昂贵,且难以覆盖长尾场景。
|
||||
|
||||
NVIDIA 的解法是:**把数据问题转化为算力问题。**
|
||||
|
||||
用 **Cosmos 3**(世界模型)合成高质量训练数据,在仿真环境中跑数百万次虚拟实验,再把经验迁移到真实机器人。
|
||||
|
||||
这个思路很优雅:**算力是 NVIDIA 最不缺的东西,所以这个解法对 NVIDIA 来说是"用长处补短处"。**
|
||||
|
||||
---
|
||||
|
||||
## 六、自动驾驶:大国车企集体入场
|
||||
|
||||
黄仁勋点名了四家新加入 NVIDIA DRIVE Hyperion 平台的汽车厂商:
|
||||
|
||||
**比亚迪、现代、日产、吉利**
|
||||
|
||||

|
||||
|
||||
这是一个值得单独拎出来说的信号。
|
||||
|
||||
中国最大的新能源车企比亚迪选择了 NVIDIA 的自动驾驶平台,这意味着什么?
|
||||
|
||||
一方面,说明 NVIDIA 在自动驾驶算力领域的竞争优势无可替代;另一方面,在中美科技博弈加剧的背景下,这笔合作能否顺利落地,本身就是一个值得持续关注的变量。
|
||||
|
||||
此外,NVIDIA 与 **Uber** 达成合作,计划到 2028 年将基于 DRIVE Hyperion 的自动驾驶车队扩展至**四大洲 28 个城市**。
|
||||
|
||||
---
|
||||
|
||||
## 七、老邓的三个判断
|
||||
|
||||
看完整场,老邓有三个判断想跟你分享:
|
||||
|
||||
### 判断一:NVIDIA 的护城河在加深,不是在变浅
|
||||
|
||||
很多人一直在问:英伟达的护城河还能守多久?AMD、英特尔、谷歌 TPU、自研芯片——威胁从四面八方涌来。
|
||||
|
||||
但 GTC 2026 告诉我,NVIDIA 的护城河逻辑正在从"GPU 性能领先"升级为"全栈生态锁定"。
|
||||
|
||||
你用 NVIDIA 的芯片,就会自然用 NVIDIA 的 CUDA。用了 CUDA,就会用 NeMo、Dynamo、Isaac 这些上层框架。用了框架,就会用 GR00T、Cosmos 这些开源模型。
|
||||
|
||||
**每一层都在为下一层建造壁垒。** 这不是一家芯片公司,这是一家 AI 基础设施公司。
|
||||
|
||||
### 判断二:推理成本的暴跌,会催生意想不到的应用
|
||||
|
||||
Vera Rubin 相比 Blackwell,token 推理成本降低 **10 倍**。
|
||||
|
||||
成本降低 10 倍,不是原有应用变便宜 10 倍——而是**大量原本"太贵跑不起来"的应用,会突然变得可行。**
|
||||
|
||||
历史一再证明这个规律:存储成本降低 10 倍,催生了云计算;带宽成本降低 10 倍,催生了视频流媒体;推理成本降低 10 倍,会催生什么?
|
||||
|
||||
老邓的猜想:**永远在线的个人 AI 助理、实时翻译与理解、全时监控与安全分析**……这些今天还"太贵"的场景,明年可能就变成标配。
|
||||
|
||||
### 判断三:物理 AI 的落地,比预期快也比预期难
|
||||
|
||||
黄仁勋说机器人市场是 50 万亿,这个数字没错。但落地需要的不只是更好的模型,还需要解决硬件可靠性、安全认证、商业模式等一系列非技术问题。
|
||||
|
||||
**技术准备好了,系统没准备好。** 这个鸿沟,不是再快一倍的 GPU 能填平的。
|
||||
|
||||
GR00T N2 预计年底出货,但从出货到大规模商用,还有很长的路要走。乐观一点估计:物理 AI 的真正爆发,可能要等 2027-2028 年。
|
||||
|
||||
---
|
||||
|
||||
## 尾声:老黄在赌什么?
|
||||
|
||||
有人说,黄仁勋是这个时代最会讲故事的 CEO。
|
||||
|
||||
但看完 GTC 2026,老邓觉得,黄仁勋讲的不只是故事——他在系统性地下注。
|
||||
|
||||
下注代理 AI 取代传统软件,下注物理 AI 改造工业世界,下注推理成本的暴跌会催生万亿市场……
|
||||
|
||||
每一笔下注,他都同时押上了芯片、软件、模型和生态——形成了别人很难复制的闭环。
|
||||
|
||||
**万亿订单背后,是一个把每一层都想清楚了的人,在有条不紊地执行一盘大棋。**
|
||||
|
||||
至于这盘棋最终下成什么样,我们拭目以待。
|
||||
|
||||
---
|
||||
|
||||
## 参考资料
|
||||
|
||||
- [Keynote by NVIDIA CEO Jensen Huang | NVIDIA GTC San Jose 2026](https://www.nvidia.com/gtc/keynote/)
|
||||
- [Nvidia GTC 2026: CEO Jensen Huang keynote | CNBC](https://www.cnbc.com/2026/03/16/nvidia-gtc-2026-ceo-jensen-huang-keynote-blackwell-vera-rubin.html)
|
||||
- [NVIDIA GTC 2026: Live Updates | NVIDIA Blog](https://blogs.nvidia.com/blog/gtc-2026-news/)
|
||||
- [NVIDIA Vera Rubin NVL72 Detailed | VideoCardz](https://videocardz.com/newz/nvidia-vera-rubin-nvl72-detailed-72-gpus-36-cpus-260-tb-s-scale-up-bandwidth)
|
||||
- [Nvidia slaps Groq into new LPX racks | The Register](https://www.theregister.com/2026/03/16/nvidia_lpx_groq_3/)
|
||||
- [NVIDIA Releases New Physical AI Models | NVIDIA Newsroom](https://nvidianews.nvidia.com/news/nvidia-releases-new-physical-ai-models-as-global-partners-unveil-next-generation-robots)
|
||||
- [GTC 2026: Nvidia wants to swap robotics' data problem for a compute problem | The Decoder](https://the-decoder.com/gtc-2026-nvidia-wants-to-swap-robotics-data-problem-for-a-compute-problem/)
|
||||
- [黄仁勋GTC演讲万字拆解 | 澎湃新闻](https://m.thepaper.cn/newsDetail_forward_30438355)
|
||||
- [NVIDIA GTC 2026 官方网站](https://www.nvidia.cn/gtc/)
|
||||
Loading…
Reference in New Issue
Block a user