A Open Compute Project Foundation (OCP), uma organização sem fins lucrativos especializada na criação de especificações de hardware abertas para data centers, anunciou que a NVIDIA e a Meta✴ fornecerão seus próprios desenvolvimentos para sua iniciativa Open Systems for AI.
O projeto Open Systems for AI foi anunciado em janeiro de 2024 com a participação de Intel, Microsoft, Google, Meta✴, NVIDIA, AMD, Arm, Ampere, Samsung, Seagate, SuperMicro, Dell e Broadcom. O objetivo da iniciativa é desenvolver padrões abertos para clusters de IA e data centers que hospedam tais sistemas. Espera-se que os Sistemas Abertos para IA ajudem a melhorar a eficiência e a sustentabilidade das plataformas de IA, bem como proporcionem a capacidade de formar cadeias de fornecimento de equipamentos de vários fabricantes.
Como parte da iniciativa, a NVIDIA fornecerá especificações OCP para elementos de design eletromecânico dos superaceleradores GB200 NVL72, incluindo arquiteturas de rack e refrigeração líquida, bandeja de computação e mecânica de bandeja de patch.
Além disso, a NVIDIA expandirá o suporte aos padrões OCP em sua infraestrutura de rede Spectrum-X. Estamos falando em garantir a compatibilidade com os padrões OCP Switch Abstraction Interface (SAI) e Software for Open Networking in the Cloud (SONiC). Isso permitirá que os clientes aproveitem o roteamento adaptativo Spectrum-X e o controle de congestionamento baseado em telemetria para melhorar o desempenho das conexões Ethernet como parte de uma infraestrutura de IA escalável. Os adaptadores ConnectX-8 SuperNIC com suporte OCP 3.0 aparecerão em 2025.
Por sua vez, a Meta✴ doará sua arquitetura Catalina AI Rack, projetada especificamente para a criação de sistemas de IA de alta densidade com suporte para GB200, para o projeto Open Systems for AI. Espera-se que isto permita à organização OCP “impulsionar a inovação necessária para criar um ecossistema de IA mais resiliente”.