Vera 正式登场:NVIDIA 首款专为智能体打造的 CPU,现已入驻顶尖 AI 实验室

代理式 AI 从一开始就需要一种全新的 CPU。NVIDIA 创始人兼首席执行官黄仁勋在今年 3 月于圣何塞举行的 GTC 上给出了答案——独立的 Vera CPU,并将其定位为 NVIDIA 下一个数十亿美元级的业务。 近日,这款 CPU 正式走出 NVIDIA 实验室,交付至客户手中。 首批 NVIDIA Vera CPU 率先送达三家全球领先的 AI 实验室,包括位于旧金山的 Anthropic、位于 Mission Bay 的 OpenAI,以及位于帕洛阿托的 SpaceXAI。随后又交

May 25, 2026 - 10:00
Vera 正式登场:NVIDIA 首款专为智能体打造的 CPU,现已入驻顶尖 AI 实验室

代理式 AI 从一开始就需要一种全新的 CPU。NVIDIA 创始人兼首席执行官黄仁勋在今年 3 月于圣何塞举行的 GTC 上给出了答案——独立的 Vera CPU,并将其定位为 NVIDIA 下一个数十亿美元级的业务。

近日,这款 CPU 正式走出 NVIDIA 实验室,交付至客户手中。

首批 NVIDIA Vera CPU 率先送达三家全球领先的 AI 实验室,包括位于旧金山的 Anthropic、位于 Mission Bay 的 OpenAI,以及位于帕洛阿托的 SpaceXAI。随后又交付至位于圣克拉拉的 Oracle Cloud Infrastructure (OCI)。NVIDIA 超大规模与高性能计算副总裁 Ian Buck 亲自将这些系统送到了客户手中。

Buck 表示:“代理式 AI 正在 AI 工厂中催生一个全新的 CPU 时刻——随着模型从单纯的‘回答问题’转向主动‘采取行动’,Vera 正是为了保障这种工作负载在大规模下高效运转而量身打造的。”

核心理念:设想一下,如果你的工作效率能提升 10 倍,你的计算机还能跟得上吗?从制作演示文稿、编译与测试软件,到数据分析、文件检索,甚至运行复杂仿真任务,代理式 AI 正对支撑各类工作的基础设施提出了前所未有的更高的要求。

AI 智能体并不能单靠 GPU 来运行。每一个智能体沙盒环境、每一次工具调用、每一层编排系统,以及每一次长上下文检索操作,都是 CPU 的工作。Vera 正是基于这一现实基础,专门设计出的新一代 CPU。

这种高并发、实时运行的任务“组合拳”,对 CPU 施加了前所未有的压力,而传统以核心密度为中心的设计理念,从未将应对这类负载作为优先目标。Vera 集成了 88 颗由 NVIDIA 专门设计的 Olympus 核心,提供 1.2 TB/s 的内存带宽,并实现单核性能提升 50%。即使在持续高负载运行环境下,也能够更快完成任务,从而提升整个 AI 工厂的运行效率,并以更快的响应速度帮助用户完成工作。

Vera 抵达旧金山,交付至 Anthropic

首站交付在位于旧金山 SoMa 区的极具现代感的 Anthropic 办公室完成。

Anthropic 计算负责人 James Bradbury 在湾区附近的会议室里亲手接过了这一棒。

Buck 手里拿着一块裸板 NVIDIA Vera CPU 主板作为参照,一步步带着 Bradbury 了解这款围绕新 CPU 打造的服务器,并详细讲解了让 Vera 与众不同的各项特性。

“扩展算力是模型增长的重要加速器,”Bradbury 表示,“在应对智能体工作负载的挑战时,我们很高兴看到 Vera 成为生态系统中一个充满潜力的新成员。”

支撑 OpenAI 的庞大算力需求

在 OpenAI 位于 Mission Bay 的总部,交付环节被安排在主办公区外的一处露天阳台上进行。

当天,旧金山以阴晴不定著称的天气格外配合。OpenAI 计算基础设施负责人 Sachin Katti 对 Buck 专程送来服务器表示感谢。

Buck 详细介绍了 Vera 的核心特性,并在演示过程中从口袋中取出一把螺丝刀,打开机箱盖,现场展示了系统内部构造。

在半岛地区走进 SpaceXAI

当天的最后一站交付在 SpaceXAI 位于帕洛阿托的办公室完成。

NVIDIA 团队向埃隆·马斯克详细展示了系统内部构造。马斯克在听取介绍后提出一连串问题,包括核心架构、内存布局以及散热设计等关键技术细节。

目前,SpaceXAI 正在评估 Vera 用于强化学习工作负载,以及驱动其训练栈的基于智能体的仿真流水线。

Vera 来到南湾交付至 OCI

周一,在 Oracle AI Customer Excellence Center 内,OCI 一众成员参观了刚刚开箱的 Vera CPU 系统,其中包括负责整体产品管理的 Karan Batta,以及首席客户与合作伙伴成功官 Gary Miller。与此同时,背景中在他们身后,NVIDIA GPU 机架正持续运行,处理着来自全球 OCI 客户的工作负载。该中心正是 Oracle 客户测试与验证各类 AI 工作负载的地方。

Buck 解释了 Vera 将如何提供帮助。

Buck 表示:“当 AI 模型被提出一个问题时,答案往往并不是事先准备好、能够随时调用的。模型实际上需要先生成一些 Python 代码,才能推导出正确答案。”而这正是 Vera CPU 所擅长处理的任务。“这也是我们看到 CPU 需求迅速增长的原因。”Buck 补充道。

OCI 团队同样观察到了这一趋势。

Karan Batta 表示:“OCI 计划从 2026 年开始部署数十万个 NVIDIA Vera CPU,因为代理式 AI 需要在超大规模下保持持续稳定的性能,Vera 的架构专为高吞吐量的推理工作负载而设计,能够提供 OCI 所需的能效、密度与系统占用,以赋能下一代企业级 AI。”

OCI 是首个在超大规模环境中部署 Vera 的云服务提供商。对于企业客户而言,这意味着他们能够获得生产级的代理式 AI 基础设施,而这种部署规模目前尚无其他云服务商可以比肩。

Gary Miller 表示,OCI 团队迫切希望尽快将 Vera 投入实际使用,并为客户提供另一套可用于定制与验证其代理式 AI 及相关工作负载的系统。他表示,“我非常期待看到来访者的反应,也期待与大家一起合作,充分释放 Vera 的潜力。”

Vera 带来的核心价值

Vera 是 NVIDIA 极致协同设计体系的一部分,与 NVIDIA Rubin GPU、BlueField 4 DPU、Spectrum-X 以及 MGX 机架架构共同构成整体系统设计。

除了用于驱动独立 CPU 系统之外,Vera 还是 Vera Rubin NVL72 的主处理器,它通过第二代 NVLink-C2C 与两个 Rubin GPU 协同工作。

Vera CPU 概览

是什么 —— NVIDIA 首款定制 CPU,专为代理式 AI 设计
负责什么 —— 编排、工具调用、强化学习(RL)工作负载、数据分析、智能体沙盒环境,以及长上下文状态管理
面向谁 —— AI 实验室、云服务提供商,以及运行大规模代理式 AI 的企业
核心规格 —— 88 颗专门设计的 Olympus 核心、1.2 TB/s 内存带宽、在满负载下实现单核性能提升 50%

在这些系统中,Vera 与 Rubin GPU 共享一套统一的内存架构,从而确保加速计算资源始终保持高利用率。

Vera 的高速 CPU 核心与互连架构负责处理编排、控制以及数据传输,从而以相较传统基础设施高出 2 倍的能效,为 GPU 持续提供数据支持。

代理式 AI 时代已经拥有了专为其打造的 CPU,它的名字就是——Vera。

了解更多关于 NVIDIA Vera CPU 的信息。

Jat AI Stay informed with the latest in artificial intelligence. Jat AI News Portal is your go-to source for AI trends, breakthroughs, and industry analysis. Connect with the community of technologists and business professionals shaping the future.