英伟达“数十亿美元级业务”走向落地

权威精选

当地时间5月18日，英伟达宣布，Vera CPU已完成对Anthropic、OpenAI、SpaceX AI及甲骨文云的首批交付。此举标志着英伟达创始人兼首席执行官黄仁勋此前声称的“公司下一个数十亿美元级业务”已从概念验证正式迈向商业化落地。

与生成式AI生成内容、回答问题不同，代理式AI必须执行复杂任务、调用外部工具、生成并运行代码、安排多步骤流程，甚至进行长上下文检索和强化学习沙盒计算，这些工作流对高性能CPU的协同能力提出了极高要求。

而NVIDIA Vera专为强化学习（RL）和代理式AI设计，为模型之外的代码、工具和数据工作流提供支持。作为加速系统中的主机CPU，Vera与NVIDIA GPU无缝协作，能够指导数据搬运、管理内存并编排系统控制，确保AI工作流全速运行。凭借高性能、高效的核心和海量的LPDDR5X内存带宽，Vera使软件环境的运行速度提升高达50%，效率是传统架构CPU的两倍。

具体来看，Vera搭载了88个英伟达自研的Olympus核心，拥有1.2 TB/s的内存带宽，单核性能提升了50%。在持续高负载下，任务处理速度更快，从而大幅提升整个AI系统的运行效率，实现以更迅速的响应完成工作。

在首批客户中，甲骨文的态度最为积极。“OCI（甲骨文云基础设施）计划从2026年起部署数十万颗英伟达Vera CPU，因为Vera能够提供OCI所需的效率、密度和空间占用，从而助力下一代企业级人工智能的发展。”OCI高级副总裁Karan Batta表示。

有分析人士认为，甲骨文的这一承诺表明代理式AI对CPU的需求并非单纯的技术叙事，而是可直接兑现为商业订单、拉动业绩增长的真实市场需求。

值得注意的是，Vera并非一款独立产品，而是英伟达AI工厂中的重要组成部分。它将与Rubin GPU、BlueField 4 DPU、Spectrum-X以太网网络平台以及MGX机架一道，共同构成下一代人工智能基础设施的核心。在Vera Rubin NVL72系统中，Vera可通过第二代NVLink-C2C与Rubin GPU相连，形成统一的内存架构，大幅改善GPU的数据供给效率与整体计算效能。

上述分析人士进一步表示，Vera的交付意味着英伟达的新一代人工智能硬件产品的落地兑现已从GPU扩展到CPU，未来或将进一步扩展至网络乃至机架系统。伴随行业资本开支维持高增态势，英伟达作为生成式AI与代理式AI最大受益者的市场地位或将被进一步巩固。

作者：郑维汉

（文章来源：上海证券报）

文章来源：上海证券报

原标题：英伟达“数十亿美元级业务”走向落地

英伟达“数十亿美元级业务”走向落地

分享成功

热门推荐