O Google lança processadores Arm Axion e acelerador de tensores Ironwood para treinamento e execução de modelos de IA massivos (3DNews)

Hoje, o Google apresentou seus novos processadores Axion e aceleradores de tensores Ironwood — a sétima geração de TPUs. Segundo a empresa, os chips Axion oferecem 50% mais desempenho e 60% mais eficiência energética do que os processadores x86 modernos, enquanto o Ironwood TPU é o acelerador de IA personalizável mais poderoso e escalável até o momento, e o primeiro chip do Google projetado especificamente para executar modelos de IA treinados (inferência).

Fonte da imagem: Google

O Ironwood TPU estará disponível em duas configurações: com 256 ou 9216 chips. Um único acelerador oferece uma potência computacional máxima de 4614 teraflops (FP8), enquanto um cluster de 9216 chips oferece um total de 42,5 EFLOPS com aproximadamente 10 MW. Esses números superam significativamente o desempenho do sistema Nvidia GB300 NVL72, que atinge 0,36 EFLOPS em operações FP8.

O Ironwood é equipado com um mecanismo SparseCore aprimorado, projetado para acelerar modelos de IA usados ​​em sistemas de classificação e recomendação. A implementação expandida do SparseCore no Ironwood permite a aceleração de uma gama mais ampla de cargas de trabalho, estendendo-se além da IA ​​tradicional para as áreas financeira e científica.

Os módulos são interconectados por meio de uma rede proprietária de interconexão entre chips de 9,6 Tbps e contêm aproximadamente 1,77 PB de memória HBM3E, o que também supera as capacidades da plataforma concorrente da Nvidia. Elas podem ser combinadas em clusters de centenas de milhares de TPUs.

Essa plataforma integrada de supercomputação, que o Google chama de “hipercomputador de IA”, combina funções de computação, armazenamento e rede sob um único plano de controle. Para aumentar a confiabilidade, o Google utiliza uma estrutura de comutação de circuito óptico reconfigurável que ignora instantaneamente quaisquer falhas de hardware para manter a operação contínua.

De acordo com a IDC, esse “hipercomputador de IA” oferece um retorno sobre o investimento (ROI) médio de três anos de 353%, uma redução de 28% nos custos de TI e um aumento de 55% na eficiência operacional. Diversas empresas já estão implementando a plataforma do Google.A Anthropic planeja usar até um milhão de TPUs para operações e expansão.A família de modelos Claude, citando ganhos significativos em relação custo-benefício. A Lightricks começou a implantar o Ironwood para treinamento e manutenção de seu sistema multimodal LTX-2.

As especificações completas dos processadores de uso geral Axion ainda não foram publicadas, incluindo as velocidades de clock e o processo de fabricação utilizado. Os processadores devem apresentar 2 MB de cache L2 por núcleo, 80 MB de cache L3, suporte para memória DDR5-5600 MT/s e tecnologia Uniform Memory Access (UMA).

O Axion é construído sobre a plataforma Arm Neoverse v2 e espera-se que ofereça desempenho até 50% superior e eficiência energética até 60% maior em comparação com os processadores x86 modernos. O Google também afirma que ele é 30% mais rápido do que “as instâncias de uso geral baseadas em Arm mais rápidas disponíveis na nuvem atualmente”.

Os processadores Axion podem ser usados ​​tanto em servidores de IA quanto em servidores de uso geral para resolver uma variedade de cargas de trabalho. O Google oferece atualmente três configurações do Axion: C4A, N4A e C4A Metal.

O C4A oferece até 72 vCPUs, 576 GB de memória DDR5 e rede de 100 Gbps, além de até 6 TB de armazenamento local em SSD Titanium. Essa instância é otimizada para alto desempenho consistente em uma variedade de aplicações. É o único chip disponível atualmente.

O N4A foi projetado para cargas de trabalho de uso geral, como processamento de dados, serviços web e ambientes de desenvolvimento, mas escala até 64 vCPUs, 512 GB de memória DDR5 e rede de 50 Gbps.A C4A Metal oferece aos clientes o conjunto completo de hardware Axion: até 96vCPUs, 768 GB de memória DDR5 e throughput de rede de 100 Gbps. Esta instância foi projetada para aplicações especializadas ou com restrições de licença, bem como para desenvolvimento baseado em ARM.

O processador Axion complementa o portfólio de chips especializados da empresa, e o Ironwood TPU estabelece as bases para competir com os melhores aceleradores de IA do mercado. Servidores baseados em Axion e Ironwood são equipados com controladores Titanium proprietários, que descarregam as tarefas de rede, segurança e processamento de E/S do processador, proporcionando um gerenciamento mais eficiente e, consequentemente, maior desempenho.

admin

Compartilhar
Publicado por
admin

Postagens recentes

O Pacote Completo: Graças ao sucesso no Kickstarter, o RPG não linear baseado em grupos, Starfinder: Afterlight, será lançado em sua melhor versão. (3DNews)

A campanha de financiamento coletivo no Kickstarter para o RPG de ficção científica e fantasia…

32 minutos atrás

O Spotify agora exibe estatísticas semanais de audição.

Anteriormente, o Spotify era bastante mesquinho com as estatísticas dos usuários — os fãs de…

2 horas atrás

A inteligência artificial acelerou o mercado de publicidade online e fortaleceu o domínio das gigantes de TI, como afirma a 3DNews.

As gigantes da tecnologia estão investindo pesadamente no desenvolvimento e na promoção da inteligência artificial.…

2 horas atrás

AMD reclama de ameaça de concorrência de preços devido à aliança Intel-Nvidia (3DNews)

Em seu relatório financeiro trimestral apresentado à Comissão de Valores Mobiliários dos EUA (SEC), a…

2 horas atrás