O Google revelou soluções em nuvem na I/O 2022 com base em seu acelerador TPU v4 AI, que é mais que o dobro do desempenho e três vezes a eficiência de energia do TPU v3. A empresa oferece clusters que contêm 4096 aceleradores de uma só vez, enquanto na geração anterior eles não incluíam mais de 1024 chips. Os novos clusters oferecem até 6 Tbps de largura de banda por host, permitindo que você treine rapidamente os maiores modelos.
Imagens: Google
Segundo a empresa, um cluster TPU v4 tem um desempenho de mais de 1 Eflops. É verdade, neste caso estamos falando de cálculos BF16 ou INT8. Um acelerador de nuvem TPU v4 equipado com 32 GB de memória HBM2 (1,2 TB/s) produz até 275 Tflops neste modo, consumindo em média 170 watts. Agora, a empresa está ocupada instalando esses clusters em seus próprios data centers, e a energia de muitos deles será 90% fornecida por fontes “verdes” livres de carbono.
Um desses data centers, localizado em Mays County (Oklahoma), recebeu um complexo de oito clusters TPU v4 com um desempenho total de cerca de 9 Eflops. De acordo com a empresa, este é o mais produtivo entre os clusters disponíveis publicamente (US$ 3,22/hora por chip) desta classe.
Há vários dias, a mídia está repleta de rumores de que a Nvidia pode abandonar…
A Microsoft está desenvolvendo um Mercado de Conteúdo para Editores (PCM, na sigla em inglês)…
Pesquisadores da Wiz descobriram sérios problemas de segurança no Moltbook, uma rede social para agentes…
O Departamento de Justiça dos EUA e um grupo de 38 estados recorreram da decisão…
A Intel vem tentando retornar ao mercado de placas de vídeo dedicadas desde a última…
As ações da AMD já haviam subido no dia anterior à publicação de seus relatórios…