A Oracle anunciou o cluster de IA baseado em nuvem OCI Zettascale10, alimentado por centenas de milhares de aceleradores NVIDIA implantados em vários data centers, com um desempenho máximo de IA de 16 3flops (precisão de cálculo não especificada). O OCI Zettascale10 é a infraestrutura que alimenta o principal supercluster de IA da empresa, construído em conjunto com a OpenAI em Abilene, Texas, como parte do Projeto Stargate e baseado na arquitetura de rede Acceleron RoCE de próxima geração da Oracle.

O OCI Zettascale10 utiliza a NVIDIA Spectrum-X Ethernet — a primeira plataforma Ethernet da NVIDIA — que oferece escalabilidade massiva, latência extremamente baixa entre aceleradores em um cluster, relação custo-benefício líder do setor, utilização aprimorada do cluster e a confiabilidade necessária para cargas de trabalho de IA em larga escala.

Como observado pela Oracle, o OCI Zettascale10 é uma “evolução poderosa” do primeiro cluster de IA em nuvem Zettascale, lançado em setembro de 2024. Os clusters OCI Zettascale10 estarão localizados em grandes campi de data center com capacidade para gigawatts, densamente distribuídos em um raio de dois quilômetros para garantir latência ideal entre aceleradores para cargas de trabalho de treinamento de IA em larga escala. Essa é a abordagem escolhida para o campus Stargate, no Texas.

A Oracle observou que, além da capacidade de construir, treinar e implantar os maiores modelos de IA, consumindo menos energia por unidade de desempenho e garantindo alta confiabilidade, os clientes terão a liberdade de operar na nuvem distribuída da Oracle com controle rigoroso de dados e soberania de IA.

Fonte da imagem: OpenAI

Os clusters OCI Zettascale10 suportarão inicialmente implantações de até 800.000 aceleradores NVIDIA, proporcionando desempenho previsível e alta eficiência de custos, além de alta taxa de transferência entre eles graças à interconexão RoCEv2 de latência ultrabaixa da Oracle, Acceleron. O Acceleron oferece conectividade 400G/800G de latência ultrabaixa, uma topologia de duas camadas, múltiplas conexões de uma única placa de rede para vários switches com isolamento de rede física e lógica, suporte a LPO/LRO e flexibilidade de configuração.

A OCI já está aceitando pedidos para o OCI Zettascale10, que estará disponível no segundo semestre do próximo ano. Em agosto, a NVIDIA anunciou a solução Ethernet Spectrum-XGS para consolidar vários data centers em uma única superfábrica de IA, que deverá ser adotada não apenas pela Oracle, mas também pela Meta✴.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *