当地时间5月18日,英伟达宣布,Vera CPU已完成对Anthropic、OpenAI、SpaceX AI及甲骨文云的首批交付。此举标志着英伟达创始人兼首席执行官黄仁勋此前声称的“公司下一个数十亿美元级业务”已从概念验证正式迈向商业化落地。

与生成式AI生成内容、回答问题不同,代理式AI必须执行复杂任务、调用外部工具、生成并运行代码、安排多步骤流程,甚至进行长上下文检索和强化学习沙盒计算,这些工作流对高性能CPU的协同能力提出了极高要求。
而NVIDIA Vera专为强化学习(RL)和代理式AI设计,为模型之外的代码、工具和数据工作流提供支持。作为加速系统中的主机CPU,Vera与NVIDIA GPU无缝协作,能够指导数据搬运、管理内存并编排系统控制,确保AI工作流全速运行。凭借高性能、高效的核心和海量的LPDDR5X内存带宽,Vera使软件环境的运行速度提升高达50%,效率是传统架构CPU的两倍。
具体来看,Vera搭载了88个英伟达自研的Olympus核心,拥有1.2 TB/s的内存带宽,单核性能提升了50%。在持续高负载下,任务处理速度更快,从而大幅提升整个AI系统的运行效率,实现以更迅速的响应完成工作。
在首批客户中,甲骨文的态度最为积极。“OCI(甲骨文云基础设施)计划从2026年起部署数十万颗英伟达Vera CPU,因为Vera能够提供OCI所需的效率、密度和空间占用,从而助力下一代企业级人工智能的发展。”OCI高级副总裁Karan Batta表示。
有分析人士认为,甲骨文的这一承诺表明代理式AI对CPU的需求并非单纯的技术叙事,而是可直接兑现为商业订单、拉动业绩增长的真实市场需求。
值得注意的是,Vera并非一款独立产品,而是英伟达AI工厂中的重要组成部分。它将与Rubin GPU、BlueField 4 DPU、Spectrum-X以太网网络平台以及MGX机架一道,共同构成下一代人工智能基础设施的核心。在Vera Rubin NVL72系统中,Vera可通过第二代NVLink-C2C与Rubin GPU相连,形成统一的内存架构,大幅改善GPU的数据供给效率与整体计算效能。
上述分析人士进一步表示,Vera的交付意味着英伟达的新一代人工智能硬件产品的落地兑现已从GPU扩展到CPU,未来或将进一步扩展至网络乃至机架系统。伴随行业资本开支维持高增态势,英伟达作为生成式AI与代理式AI最大受益者的市场地位或将被进一步巩固。
作者:郑维汉
(文章来源:上海证券报)
