Google revela o Ironwood, seu processador de IA mais poderoso – até 4,6 quatrilhões de operações por segundo

Na conferência Cloud Next desta semana, o Google revelou um novo chip dedicado à IA chamado Ironwood. Esta já é a sétima geração de processadores de IA da empresa e o primeiro TPU otimizado para inferência — o trabalho de modelos de IA já treinados. O processador será usado no Google Cloud e será entregue em sistemas de duas configurações: servidores com 256 desses processadores e clusters com 9216 desses chips.

Fonte da imagem: Google

«Ironwood é nosso TPU mais potente, produtivo e com maior eficiência energética até o momento. “Ele foi projetado para acelerar a inferência de modelos de IA na escala da infraestrutura de nuvem”, disse Amin Vahdat, vice-presidente do Google Cloud, comentando sobre o anúncio do processador.

O anúncio da Ironwood ocorre em meio à crescente concorrência no espaço de aceleradores proprietários de IA. Enquanto a Nvidia domina esse mercado, a Amazon e a Microsoft também estão impulsionando suas soluções tecnológicas. A primeira desenvolveu os processadores de IA Trainium, Inferentia e Graviton que são usados ​​em sua infraestrutura de nuvem AWS, enquanto a Microsoft usa seus próprios chips de IA Cobalt 100 em instâncias de nuvem do Azure.

O Google afirma que o Ironwood tem um desempenho de computação máximo de 4.614 teraflops, ou 4.614 trilhões de operações por segundo. Portanto, um cluster de 9216 desses chips oferecerá um desempenho de 42,5 Exaflops.

Cada processador é equipado com 192 GB de RAM dedicada com uma largura de banda de 7,4 Tbps. O chip também inclui um núcleo SparseCore avançado e especializado para manipular os tipos de dados comuns em cargas de trabalho de “classificação avançada” e “sistemas de recomendação” (como um algoritmo que sugere roupas que você pode gostar). A arquitetura TPU é otimizada para minimizar a movimentação de dados e a latência, o que, segundo o Google, resulta em economia de energia significativa.

A empresa planeja usar o Ironwood em seu cluster de computação modular AI Hypercomputer como parte do Google Cloud.

avalanche

Postagens recentes

Conforme as cartas forem lançadas, conforme a rede ditar: a AWS está implementando uma arquitetura de rede RNG quase aleatória em seus data centers.

A AWS publicou uma descrição técnica da arquitetura de rede de data center que implementará…

13 horas atrás

O chefe da NASA afirma que os voos do foguete New Glenn não serão retomados antes de 2028, eliminando a Blue Origin da corrida lunar.

Durante um teste estático de ignição em 29 de maio de 2026, o foguete New…

14 horas atrás

Foi anunciado o sucessor espiritual de Zeus: Master of Olympus – o jogo de estratégia de construção de cidades Theos: Cities of Myth, onde história e mito se entrelaçam.

A editora Dotemu (Ninja Gaiden: Ragebound, Marvel Cosmic Invasion) e a Triskell Interactive, desenvolvedora de…

14 horas atrás

Plataforma de referência de IA Qualcomm Dragonwing IQ10 para robótica é apresentada.

Cristiano Amon, CEO da Qualcomm, apresentou a plataforma robótica Dragonwing IQ10 atualizada na Computex 2026.…

15 horas atrás

O RPG infernal baseado em turnos, Entropy, do criador de Dread Delusion, recebeu uma demo e uma data de lançamento no Acesso Antecipado do Steam.

A editora DreadXP e o estúdio britânico Lovely Hellplace (Dread Delusion) anunciaram a data de…

15 horas atrás