撰文:Techub News 整理
导语
2026年6月,NVIDIA 创始人兼 CEO Jensen Huang(黄仁勋)重返台北,在年度 GPU 技术大会(GTC)上发表主题演讲。此次演讲正值生成式 AI 浪潮席卷全球、计算需求空前高涨之际。黄仁勋不仅向全球(超过70个国家同步直播)展示了 NVIDIA 如何通过其庞大的软硬件生态推动这场变革,更首次系统性地定义了下一代计算范式——「代理式 AI」(Agentic AI),并发布了一系列旨在重塑从数据中心到个人电脑的划时代产品。
摘要
- AI 已从「生成」进入「有用」阶段,代理(Agent)成为新的计算范式核心,能观察、推理、规划并使用工具完成复杂任务。
- 发布 Vera Rubin 超级计算机,这是首个专为代理式 AI 设计的「多机架 Pod 规模」系统,已全面投入生产,标志着 NVIDIA 从 GPU 公司向 AI 基础设施公司的彻底转型。
- 推出革命性的 Vera CPU,这是首款专为「没有耐心」的 AI 代理设计的 CPU,强调单线程性能、极致带宽和能效,旨在消除 AI 工厂的瓶颈。
- 与微软深度合作,推出全新 PC 产品线 RTX Spark,重塑已有 40 年历史的个人计算,让本地 AI 代理成为未来 PC 的核心体验。
- 发布一系列开放模型与平台,包括 Nemotron-3 Ultra 模型、Cosmos 3 物理 AI 基础模型、Alpamayo 2 自动驾驶模型以及 Isaac GR00T 人形机器人开发平台,旨在赋能整个 AI 开发生态。

「有用的 AI」时代来临:代理成为新范式
Jensen Huang(黄仁勋)开篇明义,指出人工智能的发展已经跨越了一个关键里程碑。两年前在台北,他谈论的是生成式 AI 的兴起;而今天,「有用的 AI」(useful AI)已经到来。他以软件工程师生产力为例,通过 GitHub 提交数据指出,在 AI 辅助下,全球软件开发者创造了远超其薪资成本的价值,这证明了 AI 不是在减少工作,而是在创造巨大的经济产出和更多的就业需求。
这种「有用性」的直接体现,是一种全新的计算模式——代理(Agent)。黄仁勋解释道,代理不再仅仅是像 ChatGPT 那样生成文本或代码的单一模型,而是一个由大型语言模型(大脑)、协调器(线束)、工具技能以及运行时环境组成的复杂系统。它能理解用户意图(观察),进行逻辑思考(推理),制定步骤(规划),并调用各种工具(如 CAD 软件、数据库、浏览器)来执行任务,最终产生有价值的结果。
「这就是未来的计算方式。」黄仁勋强调,这种代理模式是「终极的分解与分布式计算」,其应用将遍及各行各业。每一个企业未来都将运行自己的代理,都需要自己的「操作系统」来管理这些 AI 员工。这为软件公司带来了前所未有的机会,因为 AI 代理将使用比人类更多的工具。
为了支撑这一范式,NVIDIA 将其积累了二十多年的 CUDA-X 加速库全面「呈现」给 AI 代理。这些库涵盖了从科学计算到物理模拟的各个领域,将成为代理手中强大的「技能手册」,让 AI 能够解决世界上最复杂的问题。

Vera Rubin:为代理式 AI 而生的超级基础设施
如果说上一代的 Grace Blackwell 超级计算机是为 AI 训练和推理优化,那么本次发布的 Vera Rubin 则是专为代理式 AI 工作负载从头设计的革命性系统。黄仁勋宣布,Vera Rubin 现已全面投入生产。
Vera Rubin 不仅仅是一个 GPU 或一台服务器,而是一个「多机架 Pod 规模」的超级计算机。它集成了七种新型芯片,采用台积电 3nm 工艺,包含超过一百万个组件。其设计核心是「极限协同设计」,通过消除机架内电缆、采用模块化计算托盘和液冷总线等创新,将系统可靠性、吞吐量和能效推向极致。
黄仁勋深入剖析了代理工作负载对基础设施的苛刻要求:计算即收入,每瓦性能即利润。在 AI 工厂中,每一个生成的 Token(AI 输出单位)都直接对应收入和利润。因此,系统的吞吐量、延迟、可靠性和使用寿命至关重要。Vera Rubin 的设计目标就是以最高的能效和最低的成本生产 Token,并确保整个系统能够随着 AI 软件的快速演进而长期保持价值。
「NVIDIA 已经成为一家人工智能基础设施公司。」黄仁勋表示,NVIDIA 的 DSX(数据中心规模基础设施)蓝图正在帮助全球客户构建极其复杂的千兆瓦级 AI 工厂。从数字孪生模拟(使用 Omniverse)到动态电力和冷却管理,NVIDIA 提供的是端到端的解决方案,确保客户的基础设施从第一天起就能高效、盈利地运行。

Vera CPU:为「没有耐心」的 AI 代理重塑计算核心
在代理范式中,CPU 的角色发生了根本性转变。黄仁勋指出,传统 CPU 是为人类用户设计的,人类以「秒」为单位感知响应;而 AI 代理生活在「纳秒」世界,极其「没有耐心」。当代理调用工具或访问数据时,任何等待都会拖慢整个任务链。
因此,NVIDIA 推出了首款为 AI 代理时代设计的 CPU——Vera。它基于全新的 NVIDIA Olympus 核心架构,拥有四大特性:
- 极高的单线程性能(IPC):每时钟周期可解码执行多达10条指令,以实现最低延迟。
- 世界级的核心间与片外带宽:采用一致性网格架构,避免「Chiplet 税」,核心间通信带宽高达每秒 3.6 TB。
- 革命性的内存带宽:率先支持 LPDDR5X,带宽是市面上高性能 CPU 的 2-3 倍。
- 极致的能效:在有限电力预算下塞入更多核心,以支持海量 AI 代理并发。
黄仁勋展示了 Vera CPU 在真实工作负载中的惊人表现:运行 SQL 查询比传统 x86 CPU 快 3 倍,实时流处理性能提升 6 倍。他强调,Vera 不是要取代现有 CPU 市场,而是开创一个全新的「代理 CPU」市场。未来 AI 代理的数量将远超人类,这个市场的规模注定更加庞大。随着 Vera Rubin 超级计算机的普及,Vera CPU 也将成为 AI 世界中优化程度最高、应用最广泛的处理器之一。

重塑个人计算:RTX Spark 与 AI PC 新时代
黄仁勋将目光从数据中心投向个人设备,宣布与微软紧密合作,彻底重塑已有 40 年历史的个人电脑。全新的 PC 产品线被命名为 RTX Spark。
RTX Spark 的核心是一颗集成了 Blackwell RTX GPU、定制 Grace CPU(与联发科合作)的超级芯片,采用台积电 3nm 工艺,拥有 700 亿晶体管。它支持 NVIDIA 全部软件栈,并能本地或云端运行 AI 代理。

黄仁勋演示了未来 AI PC 的体验:用户可以通过自然语言吩咐本地代理,调用 Rhino、Blender 等专业工具,自动完成从房屋设计草图到 3D 建模、渲染的全流程。代理在后台协调各种软件,用户只需提出想法和做出关键决策。Adobe 等软件巨头也已针对 RTX Spark 优化其应用,使其运行速度提升两倍,并对代理友好。
更宏大的愿景是,未来的 PC 形态将多样化:从 RTX Spark 笔记本、台式机,到可 24/7 运行的家庭 AI 主机(连接家中所有设备),再到拥有 768GB 内存、可运行万亿参数模型的桌面 AI 工作站(DGX 4)。「你家里会有一台 AI 超级计算机,就像现在有家庭影院一样自然。」黄仁勋预测,这些设备将运行越来越聪明的个人 AI 代理,成为像 R2-D2 或 C-3PO 一样的伙伴,而不仅仅是工具。

开放生态:赋能物理 AI 与机器人未来
演讲的后半部分,黄仁勋聚焦于 AI 在物理世界的应用。他指出,物理 AI(如机器人、自动驾驶)面临的最大挑战是数据稀缺。为此,NVIDIA 发布了多项关键开源模型与平台:
- Cosmos 3:前沿的物理 AI 基础模型,能从任何视角理解、推理和生成物理世界场景,是开发各类机器人的「世界模型」。
- Nemotron-3 Ultra:全新的开放大模型,采用混合状态空间模型与专家混合架构,速度比同类领先模型快 5 倍,成本低 30%,并开放全部训练数据和脚本。
- Alpamayo 2:基于推理的自动驾驶汽车开放模型,已与全球约 80% 的汽车制造商合作。
- Isaac GR00T:人形机器人开发平台,包含参考机器人硬件、开放模型、模拟器(Isaac Lab)、训练库和运行时(Jetson Thor),旨在将机器人研究从数月的环境搭建缩短到数小时。
黄仁勋强调,无论是云端的代理系统、PC 的代理系统,还是机器人系统,其底层计算模式都是同一套「代理范式」。NVIDIA 通过提供从芯片、系统、模型到开发工具的完整、开放、垂直整合的栈,赋能整个生态去创造未来。
在演讲的最后,黄仁勋感谢了台湾供应链伙伴的卓越贡献,并强调台湾是这一切开始的起点。随着 Vera Rubin 全面投产、Vera CPU 面世、全新 AI PC 产品线启动,以及一系列开放模型的发布,NVIDIA 正携手全球生态,共同迈向以 Agentic AI 为核心的光明新未来。




