Os primeiros processadores Vera da NVIDIA foram entregues à Anthropic, OpenAI, Oracle Cloud Infrastructure (OCI) e SpaceX/xAI. Esses processadores são projetados especificamente para sistemas de IA baseados em agentes e diferem dos processadores convencionais.
Este é o primeiro processador personalizado da NVIDIA projetado especificamente para sistemas baseados em agentes. Ele oferece suporte a orquestração, invocação de ferramentas, cargas de trabalho de aprendizado por reforço (RL), análise de dados, ambientes de teste (sandboxes) para agentes e muito mais. O processador foi projetado para laboratórios de IA, provedores de nuvem e empresas que trabalham com sistemas de IA baseados em agentes em grande escala. O modelo apresenta 88 núcleos Olympus personalizados e uma largura de banda de memória de 1,2 TB/s.
O CEO da NVIDIA, Jensen Huang, posiciona o Vera como um novo vetor de crescimento multibilionário para a empresa. De acordo com a NVIDIA, a IA baseada em agentes impõe uma carga muito maior na infraestrutura de computação, desde a compilação e teste do código do programa até a análise de dados, busca de arquivos e muito mais. Além disso, os agentes de IA não apenas utilizam aceleradores, mas também exigem orquestração, gerenciamento de ambientes de teste (sandboxes) para agentes e assim por diante — todo o trabalho é limitado pela CPU. A avalanche de tarefas paralelas sobrecarrega CPUs que não foram projetadas para isso, mas as características da Vera permitem maior eficiência em fábricas de IA inteiras.

Fonte da imagem: NVIDIA
A OCI pretende implantar centenas de milhares de CPUs Vera para impulsionar a próxima geração de IA empresarial. É a primeira provedora de nuvem a se comprometer com a implantação do Vera em tal escala. Para clientes corporativos, isso significa a criação de infraestrutura de IA baseada em agentes em um nível indisponível para outros provedores de nuvem. Anteriormente, a Oracle supostamente estava construindo data centers “ultrapassados” sem financiamento suficiente, e agora a empresa parece pronta para refutar essa alegação.

Fonte da imagem: NVIDIA
O processador não é apenas uma CPU independente, mas também forma a base da plataforma Vera Rubin NVL72, onde está conectado a um par de GPUs Rubin por meio da tecnologia NVLink-C2C de segunda geração. Vale ressaltar que o trabalho com a arquitetura Vera já está em andamento há algum tempo. Por exemplo, em março, a HPE apresentou nós baseados na arquitetura NVIDIA Vera para a plataforma Cray Supercomputing GX5000.
Se você notar algum erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você consegue escrever uma versão melhor? Ficaremos felizes em receber seu feedback.
Fonte: NVIDIA