feat(article): 添加英伟达GTC 2026深度解读文章

- 新增05号文章《英伟达GTC 2026深度解读（上篇）：万亿订单背后，老黄在押注什么》 - 详细介绍GTC 2026大会硬件路线图包括Vera Rubin、Rubin Ultra和Feynman架构 - 分析NVIDIA收购Groq整合推理加速器的战略布局 - 解读NemoClaw企业级代理AI平台和六大开放模型家族 - 探讨机器人物理AI和自动驾驶业务发展规划 - 补充完善图片规范文档，明确七牛云OSS转存要求
2026-03-17 09:53:49 +08:00 · 2026-03-17 09:53:49 +08:00 · 887595784c
commit 887595784c
parent 52ee025c75
2 changed files with 277 additions and 0 deletions
--- a/CLAUDE.md
+++ b/CLAUDE.md
@ -10,3 +10,11 @@
 - 存放已发布的历史文章
 - 命名规则：`{编号}-{文章标题}.md`，如 `001-标题.md`、`002-标题.md`
 - 每篇文章有对应的同编号目录存放素材，如 `001/`、`002/`
+
+# 图片规范
+
+- 文章中所有图片（包括从外部抓取的官方图片）必须先转存到七牛云 OSS，再替换为七牛 CDN 链接
+- 七牛 CDN 域名：`https://cdn.union.jxyunge.com/self-media/`
+- 图片存放路径规则：`{编号}/{文件名}`，如 `005/cover.jpg`、`005/rubin-gpu.jpg`
+- 禁止在正式文章中直接引用第三方图片链接（外链不稳定，可能失效）
+- 使用 `/upload-qiniu` 工具上传图片到七牛
--- a/2026深度解读（上篇）：万亿订单背后，老黄在押注什么.md
+++ b/2026深度解读（上篇）：万亿订单背后，老黄在押注什么.md
@ -0,0 +1,269 @@
+# 英伟达GTC 2026深度解读（上篇）：万亿订单背后，老黄在押注什么
+
+> 发布日期：2026-03-17
+> 分类：深度解读 / 行业趋势
+> 作者：老邓唠AI
+
+![封面 — GTC 2026 SAP Center 主题演讲场馆](https://cdn.union.jxyunge.com/self-media/005/gtc26-sap-center.jpg)
+
+## 引子：老黄又演了 4 个小时
+
+![GTC 2026 预展现场](https://cdn.union.jxyunge.com/self-media/005/gtc26-preshow.jpg)
+
+3月16日，圣何塞 SAP 中心。
+
+黄仁勋站在台上，穿着他标志性的黑色皮衣，讲了整整 **4 个小时**。
+
+台下是 2.5 万名来自全球的工程师、研究员和投资人。线上同步收看的超过 **30 万人**。
+
+这不是一场普通的发布会。这是英伟达向全世界宣告：**AI 的基础设施战争，我们打算一直赢下去。**
+
+演讲结束时，黄仁勋公布了一个数字——Blackwell 与 Vera Rubin 的累计采购订单，预计到 2027 年将突破 **1 万亿美元**。
+
+老邓看完整场，整理了将近 20 页笔记。今天这篇，带你把 GTC 2026 真正看懂。
+
+---
+
+## 一、主旋律：AI 进入"代理时代"
+
+去年 GTC，黄仁勋提出 AI 发展三阶段：生成式 AI → 代理式 AI → 物理 AI。
+
+今年的主旋律很清晰：**代理式 AI（Agentic AI）已经到来，物理 AI 开始落地。**
+
+### 什么是代理式 AI？
+
+以前的 AI 是"回答问题的工具"——你问它，它答你，完事。
+
+代理式 AI 是"能独立做事的助理"——你给它目标，它能自己拆解任务、调用工具、多步推进、完成目标。
+
+这听起来像 2024 年就在说的事，但黄仁勋的判断是：**真正的 Agentic AI 爆发，发生在推理算力大幅跃升之后。**
+
+而推理算力的大幅跃升，正是今年 GTC 的核心议题。
+
+---
+
+## 二、硬件路线图：芯片性能狂飙 900 倍
+
+这是本次大会最硬核的部分，也是最值得细看的部分。
+
+### 2.1 Vera Rubin：今年下半年的主角
+
+**Vera Rubin** 是 2026 年下半年量产的旗舰 GPU 平台，以天文学家维拉·鲁宾命名。
+
+核心参数一览：
+
+![Vera Rubin GPU 芯片](https://cdn.union.jxyunge.com/self-media/005/rubin-gpu.jpg)
+
+| 参数 | Vera Rubin GPU |
+|------|---------------|
+| 晶体管数量 | **3360 亿个**（双 reticle 拼接） |
+| 制程工艺 | TSMC 3nm |
+| 单卡推理性能 | **50 PFLOPS（NVFP4）** |
+| 单卡显存 | 288 GB HBM4 |
+| 内存带宽 | 22 TB/s |
+| 对比 Blackwell | 推理性能提升 **5 倍**，token 推理成本降低 **10 倍** |
+
+搭配的 CPU 叫 **Vera**，88 核、基于 Arm v9.2-A 架构，自带 1.5 TB LPDDR5x 内存。
+
+**最重要的不是单卡参数，而是机架级规格：**
+
+Vera Rubin NVL72 = 72 块 Rubin GPU + 36 块 Vera CPU，整机推理性能达到 **3.6 ExaFLOPS**。
+
+![Vera Rubin NVL72 七芯片机架全景](https://cdn.union.jxyunge.com/self-media/005/rubin-nvl72-rack.jpg)
+
+功耗超过 250 kW，需要全液冷。黄仁勋特别强调了一个细节：机柜安装时间从 Blackwell 的 **2 小时缩短到 5 分钟**。这说明 NVIDIA 正在把数据中心变成"标准化工厂"。
+
+### 2.2 Rubin Ultra：2027 年的下一棒
+
+| 时间 | 产品 | 推理性能 | 机架代号 | 功耗 |
+|------|------|---------|---------|------|
+| 2026 H2 | Vera Rubin NVL72 | 3.6 ExaFLOPS | — | 250 kW |
+| 2027 H2 | Rubin Ultra NVL576 | **10x Rubin** | Kyber | **600 kW** |
+| 2028 | Feynman | — | — | — |
+
+Rubin Ultra 单卡推理性能 100 PFLOPS FP4，搭配 1 TB HBM4e 显存，机架代号 "Kyber"，装满 576 张卡，功耗高达 600 kW。
+
+这个数字很夸张——600 kW 相当于一座小型变电站。**AI 数据中心正在变成能源消耗的怪兽。**
+
+### 2.3 Feynman：2028 年的技术飞跃
+
+以物理学家理查德·费曼命名的下一代架构，是本场演讲里最令人兴奋的展望：
+
+- 制程：**TSMC A16（1.6nm）**，这是目前已知最先进的工艺节点
+- 首次引入 **硅光子技术**——用光信号代替电信号传输数据
+- 首次采用 **3D Die Stacking**（三维堆叠）
+- 搭配新 CPU：**Rosa**（致敬 DNA 双螺旋发现者罗莎琳德·富兰克林）
+
+相比 Blackwell，Feynman 的性能目标是提升约 **14 倍**。
+
+这条路线图有个很有意思的命名规律：Vera Rubin（天文学家）、Feynman（物理学家）、Rosa（科学家）……NVIDIA 在用这些名字表达一种态度：**我们做的是改变世界的基础科学工作，不只是卖芯片。**
+
+---
+
+## 三、Groq 整合：花 200 亿买来推理加速器
+
+这是本次大会最出乎意料的公告之一。
+
+NVIDIA 以 **200 亿美元**收购了 Groq（绝大部分资产），并在 GTC 发布了集成产品 **Groq 3 LPU**：
+
+![NVIDIA Groq 3 LPU](https://cdn.union.jxyunge.com/self-media/005/groq3-lpu.jpg)
+
+
+| 指标 | Groq LPX 机架 |
+|------|--------------|
+| 每机架 LPU 数量 | 256 颗 |
+| 内存带宽 | **150 TB/s** |
+| 相比 Rubin HBM4 带宽 | **近 7 倍** |
+| tokens/watt 提升 | **35 倍** |
+
+这里要理解一个底层逻辑：**GPU 是训练和复杂推理的王者，但 LPU（语言处理单元）更适合高并发、低延迟的推理场景。**
+
+Groq 的 LPU 架构，用极大的内存带宽换取极快的 token 生成速度。NVIDIA 把它与 Vera Rubin 机架搭配部署，让 GPU 负责复杂计算，LPU 负责高频响应。
+
+这是一步好棋。Groq 一直是英伟达推理端最有威胁的竞争者，**买掉它，一举消除威胁，同时补全了自己的产品线。**
+
+---
+
+## 四、软件平台：NemoClaw 与六大开放模型
+
+硬件只是英伟达护城河的一半，另一半是软件生态。
+
+### 4.1 NemoClaw：企业级代理 AI 平台
+
+黄仁勋发布了 **NemoClaw**——一个基于 OpenClaw 框架的开源企业代理 AI 平台。
+
+这个命名不是巧合。**OpenClaw** 正是老邓之前介绍过的那个爆火开源 AI Agent 框架。NVIDIA 选择拥抱开源生态，而不是另起炉灶，这是非常聪明的策略。
+
+NemoClaw 核心能力：
+- 自动发现并编排 OpenClaw Agent
+- 利用本地 RTX PRO 6000 Blackwell 工作站的 4000 TOPS 算力
+- 包含 NVIDIA OpenShell 运行时 + Agent Toolkit
+
+### 4.2 六大开放模型家族
+
+这是本次 GTC 最容易被忽视但其实最重要的战略布局之一：
+
+![全球机器人生态伙伴](https://cdn.union.jxyunge.com/self-media/005/robotics-ecosystem.jpg)
+
+| 模型家族 | 定位 |
+|---------|------|
+| **Nemotron** | 语言与推理（黄仁勋宣称 Nemotron 3 Ultra 将成全球最强基础模型） |
+| **Cosmos** | 世界模型 / 视觉生成（机器人训练数据合成） |
+| **Isaac GR00T** | 通用人形机器人基础模型 |
+| **Alpamayo** | 可操控自动驾驶模型 |
+| **BioNeMo** | 生物学与化学 |
+| **Earth-2** | 天气与气候预测 |
+
+这六个模型，覆盖了 NVIDIA 认为"物理 AI"最核心的六个应用场景。每一个都是一个独立的万亿市场。
+
+**NVIDIA 的战略已经很清晰：做整个 AI 堆栈的操作系统。** 从硅片到机架，从框架到模型，从工具到部署——你用 NVIDIA 的芯片，同时用 NVIDIA 的模型，跑在 NVIDIA 的平台上。
+
+---
+
+## 五、机器人：物理 AI 正式出发
+
+黄仁勋说，工业机器人是一个 **50 万亿美元**的市场。去年是 ppt，今年开始见真章。
+
+### 5.1 GR00T N2：能力翻倍的机器人大脑
+
+上一代 GR00T N1 发布于 2025 年，今年迭代到 **GR00T N2**：
+
+- 任务完成率超领先 VLA 模型 **2 倍以上**
+- 支持更复杂的双臂协作和长链条任务
+- 预计 **2026 年底**开始向合作伙伴出货
+
+GR00T N2 的合作阵容非常豪华：1X、AGIBOT、Agility、Boston Dynamics、Figure、Hexagon Robotics、NEURA Robotics……可以说，几乎所有顶级人形机器人公司都在这个生态里。
+
+![NVIDIA Physical AI 合作伙伴全图](https://cdn.union.jxyunge.com/self-media/005/physical-ai-partners.jpg)
+
+### 5.2 Cosmos 3：解决机器人训练数据稀缺问题
+
+机器人训练最大的瓶颈是**数据**——真实世界数据采集极其昂贵，且难以覆盖长尾场景。
+
+NVIDIA 的解法是：**把数据问题转化为算力问题。**
+
+用 **Cosmos 3**（世界模型）合成高质量训练数据，在仿真环境中跑数百万次虚拟实验，再把经验迁移到真实机器人。
+
+这个思路很优雅：**算力是 NVIDIA 最不缺的东西，所以这个解法对 NVIDIA 来说是"用长处补短处"。**
+
+---
+
+## 六、自动驾驶：大国车企集体入场
+
+黄仁勋点名了四家新加入 NVIDIA DRIVE Hyperion 平台的汽车厂商：
+
+**比亚迪、现代、日产、吉利**
+
+![现代/起亚与NVIDIA合作](https://cdn.union.jxyunge.com/self-media/005/hyundai-nvidia.jpg)
+
+这是一个值得单独拎出来说的信号。
+
+中国最大的新能源车企比亚迪选择了 NVIDIA 的自动驾驶平台，这意味着什么？
+
+一方面，说明 NVIDIA 在自动驾驶算力领域的竞争优势无可替代；另一方面，在中美科技博弈加剧的背景下，这笔合作能否顺利落地，本身就是一个值得持续关注的变量。
+
+此外，NVIDIA 与 **Uber** 达成合作，计划到 2028 年将基于 DRIVE Hyperion 的自动驾驶车队扩展至**四大洲 28 个城市**。
+
+---
+
+## 七、老邓的三个判断
+
+看完整场，老邓有三个判断想跟你分享：
+
+### 判断一：NVIDIA 的护城河在加深，不是在变浅
+
+很多人一直在问：英伟达的护城河还能守多久？AMD、英特尔、谷歌 TPU、自研芯片——威胁从四面八方涌来。
+
+但 GTC 2026 告诉我，NVIDIA 的护城河逻辑正在从"GPU 性能领先"升级为"全栈生态锁定"。
+
+你用 NVIDIA 的芯片，就会自然用 NVIDIA 的 CUDA。用了 CUDA，就会用 NeMo、Dynamo、Isaac 这些上层框架。用了框架，就会用 GR00T、Cosmos 这些开源模型。
+
+**每一层都在为下一层建造壁垒。** 这不是一家芯片公司，这是一家 AI 基础设施公司。
+
+### 判断二：推理成本的暴跌，会催生意想不到的应用
+
+Vera Rubin 相比 Blackwell，token 推理成本降低 **10 倍**。
+
+成本降低 10 倍，不是原有应用变便宜 10 倍——而是**大量原本"太贵跑不起来"的应用，会突然变得可行。**
+
+历史一再证明这个规律：存储成本降低 10 倍，催生了云计算；带宽成本降低 10 倍，催生了视频流媒体；推理成本降低 10 倍，会催生什么？
+
+老邓的猜想：**永远在线的个人 AI 助理、实时翻译与理解、全时监控与安全分析**……这些今天还"太贵"的场景，明年可能就变成标配。
+
+### 判断三：物理 AI 的落地，比预期快也比预期难
+
+黄仁勋说机器人市场是 50 万亿，这个数字没错。但落地需要的不只是更好的模型，还需要解决硬件可靠性、安全认证、商业模式等一系列非技术问题。
+
+**技术准备好了，系统没准备好。** 这个鸿沟，不是再快一倍的 GPU 能填平的。
+
+GR00T N2 预计年底出货，但从出货到大规模商用，还有很长的路要走。乐观一点估计：物理 AI 的真正爆发，可能要等 2027-2028 年。
+
+---
+
+## 尾声：老黄在赌什么？
+
+有人说，黄仁勋是这个时代最会讲故事的 CEO。
+
+但看完 GTC 2026，老邓觉得，黄仁勋讲的不只是故事——他在系统性地下注。
+
+下注代理 AI 取代传统软件，下注物理 AI 改造工业世界，下注推理成本的暴跌会催生万亿市场……
+
+每一笔下注，他都同时押上了芯片、软件、模型和生态——形成了别人很难复制的闭环。
+
+**万亿订单背后，是一个把每一层都想清楚了的人，在有条不紊地执行一盘大棋。**
+
+至于这盘棋最终下成什么样，我们拭目以待。
+
+---
+
+## 参考资料
+
+- [Keynote by NVIDIA CEO Jensen Huang | NVIDIA GTC San Jose 2026](https://www.nvidia.com/gtc/keynote/)
+- [Nvidia GTC 2026: CEO Jensen Huang keynote | CNBC](https://www.cnbc.com/2026/03/16/nvidia-gtc-2026-ceo-jensen-huang-keynote-blackwell-vera-rubin.html)
+- [NVIDIA GTC 2026: Live Updates | NVIDIA Blog](https://blogs.nvidia.com/blog/gtc-2026-news/)
+- [NVIDIA Vera Rubin NVL72 Detailed | VideoCardz](https://videocardz.com/newz/nvidia-vera-rubin-nvl72-detailed-72-gpus-36-cpus-260-tb-s-scale-up-bandwidth)
+- [Nvidia slaps Groq into new LPX racks | The Register](https://www.theregister.com/2026/03/16/nvidia_lpx_groq_3/)
+- [NVIDIA Releases New Physical AI Models | NVIDIA Newsroom](https://nvidianews.nvidia.com/news/nvidia-releases-new-physical-ai-models-as-global-partners-unveil-next-generation-robots)
+- [GTC 2026: Nvidia wants to swap robotics' data problem for a compute problem | The Decoder](https://the-decoder.com/gtc-2026-nvidia-wants-to-swap-robotics-data-problem-for-a-compute-problem/)
+- [黄仁勋GTC演讲万字拆解 | 澎湃新闻](https://m.thepaper.cn/newsDetail_forward_30438355)
+- [NVIDIA GTC 2026 官方网站](https://www.nvidia.cn/gtc/)