A Oracle anunciou o maior cluster de IA zettaflops do mundo, o OCI Zettascale10: até 800.000 aceleradores NVIDIA em vários data centers.

A Oracle anunciou o cluster de IA baseado em nuvem OCI Zettascale10, alimentado por centenas de milhares de aceleradores NVIDIA implantados em vários data centers, com um desempenho máximo de IA de 16 3flops (precisão de cálculo não especificada). O OCI Zettascale10 é a infraestrutura que alimenta o principal supercluster de IA da empresa, construído em conjunto com a OpenAI em Abilene, Texas, como parte do Projeto Stargate e baseado na arquitetura de rede Acceleron RoCE de próxima geração da Oracle.

O OCI Zettascale10 utiliza a NVIDIA Spectrum-X Ethernet — a primeira plataforma Ethernet da NVIDIA — que oferece escalabilidade massiva, latência extremamente baixa entre aceleradores em um cluster, relação custo-benefício líder do setor, utilização aprimorada do cluster e a confiabilidade necessária para cargas de trabalho de IA em larga escala.

Como observado pela Oracle, o OCI Zettascale10 é uma “evolução poderosa” do primeiro cluster de IA em nuvem Zettascale, lançado em setembro de 2024. Os clusters OCI Zettascale10 estarão localizados em grandes campi de data center com capacidade para gigawatts, densamente distribuídos em um raio de dois quilômetros para garantir latência ideal entre aceleradores para cargas de trabalho de treinamento de IA em larga escala. Essa é a abordagem escolhida para o campus Stargate, no Texas.

A Oracle observou que, além da capacidade de construir, treinar e implantar os maiores modelos de IA, consumindo menos energia por unidade de desempenho e garantindo alta confiabilidade, os clientes terão a liberdade de operar na nuvem distribuída da Oracle com controle rigoroso de dados e soberania de IA.

Fonte da imagem: OpenAI

Os clusters OCI Zettascale10 suportarão inicialmente implantações de até 800.000 aceleradores NVIDIA, proporcionando desempenho previsível e alta eficiência de custos, além de alta taxa de transferência entre eles graças à interconexão RoCEv2 de latência ultrabaixa da Oracle, Acceleron. O Acceleron oferece conectividade 400G/800G de latência ultrabaixa, uma topologia de duas camadas, múltiplas conexões de uma única placa de rede para vários switches com isolamento de rede física e lógica, suporte a LPO/LRO e flexibilidade de configuração.

A OCI já está aceitando pedidos para o OCI Zettascale10, que estará disponível no segundo semestre do próximo ano. Em agosto, a NVIDIA anunciou a solução Ethernet Spectrum-XGS para consolidar vários data centers em uma única superfábrica de IA, que deverá ser adotada não apenas pela Oracle, mas também pela Meta✴.

admin

Postagens recentes

A Valve permitiu que os desenvolvedores do Steam mantivessem sua IA oculta, mas apenas se os jogadores não a virem.

A Valve fez esclarecimentos importantes em sua política de publicação de jogos no Steam em…

2 horas atrás

O Ryzen 7 9800X3D continua a morrer misteriosamente: agora também em placas-mãe Asus.

Nas últimas duas semanas, pelo menos cinco publicações apareceram no Reddit relatando falhas em processadores…

2 horas atrás

A Microsoft lançou uma atualização de emergência para o Windows 11 para ajudar os PCs a serem desligados corretamente novamente.

A Microsoft foi obrigada a lançar uma atualização de emergência para o Windows 11, apenas…

3 horas atrás

O TikTok lançou uma espécie de “Netflix para a Geração Z” — um serviço de microdramas chamado PineDrama.

O TikTok lançou discretamente um novo aplicativo, o PineDrama, para microdramas — vídeos curtos na…

3 horas atrás

O Google Chrome agora permite que os usuários desativem a IA local para se protegerem contra fraudes.

Os usuários do Google Chrome agora podem desativar o modelo de IA executado localmente que…

5 horas atrás