Google revela cluster de IA de 9 Eflops baseado em chips TPU v4 personalizados

O Google revelou soluções em nuvem na I/O 2022 com base em seu acelerador TPU v4 AI, que é mais que o dobro do desempenho e três vezes a eficiência de energia do TPU v3. A empresa oferece clusters que contêm 4096 aceleradores de uma só vez, enquanto na geração anterior eles não incluíam mais de 1024 chips. Os novos clusters oferecem até 6 Tbps de largura de banda por host, permitindo que você treine rapidamente os maiores modelos.

Imagens: Google

Segundo a empresa, um cluster TPU v4 tem um desempenho de mais de 1 Eflops. É verdade, neste caso estamos falando de cálculos BF16 ou INT8. Um acelerador de nuvem TPU v4 equipado com 32 GB de memória HBM2 (1,2 TB/s) produz até 275 Tflops neste modo, consumindo em média 170 watts. Agora, a empresa está ocupada instalando esses clusters em seus próprios data centers, e a energia de muitos deles será 90% fornecida por fontes “verdes” livres de carbono.

Um desses data centers, localizado em Mays County (Oklahoma), recebeu um complexo de oito clusters TPU v4 com um desempenho total de cerca de 9 Eflops. De acordo com a empresa, este é o mais produtivo entre os clusters disponíveis publicamente (US$ 3,22/hora por chip) desta classe.

avalanche

Postagens recentes

CEO da Nvidia nega rumores de perda de interesse em investimentos na OpenAI.

Há vários dias, a mídia está repleta de rumores de que a Nvidia pode abandonar…

1 hora atrás

A Microsoft anunciou a criação de uma plataforma para pagamento por conteúdo usado no treinamento de IA.

A Microsoft está desenvolvendo um Mercado de Conteúdo para Editores (PCM, na sigla em inglês)…

3 horas atrás

A plataforma Moltbook tem sido alvo de críticas devido a preocupações com a privacidade.

Pesquisadores da Wiz descobriram sérios problemas de segurança no Moltbook, uma rede social para agentes…

3 horas atrás

Os resultados trimestrais recordes não impediram a queda das ações da AMD após a divulgação dos resultados.

As ações da AMD já haviam subido no dia anterior à publicação de seus relatórios…

5 horas atrás