"NVIDIA Launches Vera CPU, Purpose-Built for Agentic AI | NVIDIA Newsroom"
* NVIDIA가 Vera CPU 공개: 범용 서버 CPU가 아니라 agentic AI와 강화학습(RL) 워크로드에 맞춰 설계된 전용 CPU라는 점이 핵심. 기존 전통적 랙 스케일 CPU 대비 50% 더 빠르고, 효율은 2배
* NVIDIA는 agentic AI가 확산될수록 모델 자체뿐 아니라 이를 뒷받침하는 오케스트레이션·데이터 처리·툴 실행 인프라가 중요해지며, Vera가 바로 그 역할을 맡는다고 설명
* Vera는 88개의 NVIDIA 자체 설계 Olympus 코어를 탑재
> 각 코어가 두 개 작업을 처리하는 NVIDIA Spatial Multithreading을 지원
> LPDDR5X 기반 저전력 메모리 서브시스템으로 최대 1.2TB/s 메모리 대역폭을 제공
> NVIDIA는 이를 범용 CPU 대비 대역폭은 2배, 전력은 절반 수준이라고 설명
> 즉, 컴파일러, 런타임 엔진, 분석 파이프라인, 에이전트 툴링, 오케스트레이션 같은 CPU 중심 작업을 고밀도로 돌리기 위한 구조
* agentic AI는 단순히 토큰만 생성하는 것이 아니라, 다수의 에이전트가 동시에 툴을 호출하고 코드 실행 환경을 띄우고 외부 데이터와 상호작용해야 함
> NVIDIA는 Vera CPU 랙 하나로 256개 수랭 Vera CPU를 집적해 22,500개 이상의 동시 CPU 환경을 풀성능으로 운영할 수 있다고 밝힘
> GPU가 추론·학습을 맡는 동안 CPU는 대규모 병렬 에이전트 실행 환경을 관리하는 컨트롤 플레인 + 데이터 플레인 역할을 담당하는 구조로 해석
* Rubin 플랫폼 안에서의 역할
> Vera는 독립 CPU 제품이면서 동시에 Vera Rubin NVL72 플랫폼의 CPU 축
> Vera CPU와 GPU를 NVLink-C2C로 연결해 1.8TB/s coherent bandwidth를 제공한다고 설명
> PCIe Gen 6의 7배 대역폭이라고 밝힘
> Vera는 HGX Rubin NVL8 시스템의 호스트 CPU로도 쓰이며, GPU 가속 워크로드의 데이터 이동과 시스템 제어를 담당
> 결국 Rubin 플랫폼에서 Vera는 단순 범용 CPU가 아니라 GPU 클러스터를 실질적으로 움직이는 운영 두뇌 역할
* NVIDIA는 Vera 기반 시스템이 강화학습, agentic inference, 데이터 처리, 오케스트레이션, 스토리지 관리, 클라우드 애플리케이션, HPC에 적합하다고 설명
> 모든 구성에 ConnectX SuperNIC와 BlueField-4 DPU가 함께 들어가 네트워킹·스토리지·보안까지 가속한다고 밝힘
> CPU 단품 판매가 아니라, CPU+NIC+DPU가 결합된 AI 인프라 표준 스택으로 밀고 있는 모습
* 생태계 채택 상황
> 배포 협력사: Alibaba, ByteDance, Meta, Oracle Cloud Infrastructure 등
> 클라우드 및 AI 인프라 사업자: CoreWeave, Lambda, Nebius, Nscale, Crusoe, Together.AI, Vultr, Cloudflare 등
> 제조 파트너: Dell, HPE, Lenovo, Supermicro, ASUS, Foxconn, GIGABYTE, Pegatron, QCT, Wiwynn 등
https://nvidianews.nvidia.com/news/nvidia-launches-vera-cpu-purpose-built-for-agentic-ai