Categorias: Mercado de tecnologia e TI. notícia

Google anuncia disponibilidade de aceleradores TPU v6 Trillium AI

O Google anunciou que seus mais recentes aceleradores de IA TPU v6, codinome Trillium, estão disponíveis para clientes para análise como parte da plataforma de nuvem GCP. Afirma-se que hoje o novo produto é a solução mais eficaz do Google em termos de relação preço/desempenho.

A apresentação oficial do Trillium aconteceu em maio deste ano. O produto é equipado com 32 GB de memória HBM com largura de banda de 1,6 TB/s, e a interconexão entre chips ICI oferece a capacidade de transferir dados em velocidades de até 3,58 Tbit/s (quatro portas por chip). São usados blocos SparseCore de terceira geração, projetados para acelerar o trabalho com modelos de IA usados em sistemas de classificação e recomendação.

Fonte da imagem: Google

O Google destaca uma série de vantagens significativas do Trillium (TPU v6e) sobre os aceleradores TPU v5e:

Aumento de mais de quatro vezes no desempenho ao treinar modelos de IA;
O desempenho da inferência aumenta até três vezes;
Melhoria da eficiência energética em 67%;
Aumento no desempenho máximo de computação por chip em 4,7 vezes;
Aumento duplo na capacidade da HBM;
Dobrando o rendimento da interconexão entre chips ICI.

Um nó inclui oito aceleradores TPU v6e (em dois domínios NUMA), dois processadores sem nome (180 vCPUs no total), 1,44 TB de RAM e quatro adaptadores 200G (dois por CPU) para comunicação com o mundo exterior. Observa-se que até 256 produtos Trillium podem ser conectados diretamente por meio de ICI, e a velocidade de conexão de rede agregada de tal cluster (Pod) é de 25,6 Tbit/s. Dezenas de milhares de aceleradores podem ser conectados em um cluster de IA em grande escala graças à plataforma de comutação óptica Júpiter do Google, com uma taxa de transferência combinada de até 13 Pbps. Trillium está disponível como parte da plataforma de IA integrada AI Hypercomputer.

Diz-se que o software Multislice Trillium fornece escalonamento de desempenho quase linear para cargas de trabalho de treinamento de IA. Clusters baseados em Trillium podem fornecer até 91 Eflops de desempenho de IA, quatro vezes mais rápido do que as maiores implantações de TPU v5p. O desempenho do BF16 de um único chip TPU v6e é de 918 Tflops e INT8 – 1836 Tops.

Nos benchmarks Trillium, comparado ao TPU v5e, ele mostrou um aumento de mais de quatro vezes no desempenho ao treinar os modelos Gemma 2-27b, MaxText Default-32b e Llama2-70B, bem como um aumento de mais de três vezes para LLama2 -7b e Gemma2-9b. Além disso, o Trillium fornece um aumento de três vezes no desempenho de inferência para Stable Diffusion XL (em relação ao TPU v5e). Em termos de relação preço/desempenho, a TPU v6e demonstra um aumento de 1,8 vezes em comparação com a TPU v5e e aproximadamente 2 vezes o aumento em comparação com a TPU v5p. Não foi especificado se uma modificação mais produtiva do TPU v6p aparecerá.

avalanche

Próximo Bélgica junta-se à França na investigação do Telegram »

Anterior « Durov anunciou dez novos recursos para miniaplicativos no Telegram

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

A Samsung está preparando SSDs Nearline de petabytes — alta capacidade, mas não muito confiáveis.

A Scality, especialista em armazenamento definido por software (SDS), revelou detalhes de uma nova classe…

2 horas atrás

Na vanguarda da ciência

Os geoengenheiros da Stardust propuseram resfriar a Terra pulverizando uma “areia” refletora especial na estratosfera.

A Stardust Solutions, empresa especializada em tecnologias de geoengenharia, propôs uma solução que, segundo ela,…

2 horas atrás

O mundo da robótica

Robôs humanoides da Figure AI aprenderam a separar encomendas 24 horas por dia.

A Figure AI relatou que, durante os testes, seus robôs humanoides operaram por mais de…

4 horas atrás

Processadores

Os EUA suspeitam que a Arm pratique comportamento anticoncorrencial.

A Comissão Federal de Comércio dos EUA (FTC, na sigla em inglês) iniciou uma investigação…

4 horas atrás

Processadores

O processador Intel Core i9-14900KF foi overclockado para 9206,34 MHz – um novo recorde mundial.

Um overclocker chinês apelidado de "Wytiwx" estabeleceu um novo recorde mundial de overclock de CPU,…

4 horas atrás

Programas

A Microsoft permitirá que você altere a posição da barra de tarefas e o tamanho do menu Iniciar no Windows 11.

Em uma versão de teste do Windows lançada recentemente, os desenvolvedores implementaram diversos recursos muito…

4 horas atrás

Google anuncia disponibilidade de aceleradores TPU v6 Trillium AI

Conteúdo relacionado

Postagens recentes

A Samsung está preparando SSDs Nearline de petabytes — alta capacidade, mas não muito confiáveis.

Os geoengenheiros da Stardust propuseram resfriar a Terra pulverizando uma “areia” refletora especial na estratosfera.

Robôs humanoides da Figure AI aprenderam a separar encomendas 24 horas por dia.

Os EUA suspeitam que a Arm pratique comportamento anticoncorrencial.

O processador Intel Core i9-14900KF foi overclockado para 9206,34 MHz – um novo recorde mundial.

A Microsoft permitirá que você altere a posição da barra de tarefas e o tamanho do menu Iniciar no Windows 11.