Google revela o Ironwood, seu processador de IA mais poderoso – até 4,6 quatrilhões de operações por segundo

Na conferência Cloud Next desta semana, o Google revelou um novo chip dedicado à IA chamado Ironwood. Esta já é a sétima geração de processadores de IA da empresa e o primeiro TPU otimizado para inferência — o trabalho de modelos de IA já treinados. O processador será usado no Google Cloud e será entregue em sistemas de duas configurações: servidores com 256 desses processadores e clusters com 9216 desses chips.

Fonte da imagem: Google

«Ironwood é nosso TPU mais potente, produtivo e com maior eficiência energética até o momento. “Ele foi projetado para acelerar a inferência de modelos de IA na escala da infraestrutura de nuvem”, disse Amin Vahdat, vice-presidente do Google Cloud, comentando sobre o anúncio do processador.

O anúncio da Ironwood ocorre em meio à crescente concorrência no espaço de aceleradores proprietários de IA. Enquanto a Nvidia domina esse mercado, a Amazon e a Microsoft também estão impulsionando suas soluções tecnológicas. A primeira desenvolveu os processadores de IA Trainium, Inferentia e Graviton que são usados ​​em sua infraestrutura de nuvem AWS, enquanto a Microsoft usa seus próprios chips de IA Cobalt 100 em instâncias de nuvem do Azure.

O Google afirma que o Ironwood tem um desempenho de computação máximo de 4.614 teraflops, ou 4.614 trilhões de operações por segundo. Portanto, um cluster de 9216 desses chips oferecerá um desempenho de 42,5 Exaflops.

Cada processador é equipado com 192 GB de RAM dedicada com uma largura de banda de 7,4 Tbps. O chip também inclui um núcleo SparseCore avançado e especializado para manipular os tipos de dados comuns em cargas de trabalho de “classificação avançada” e “sistemas de recomendação” (como um algoritmo que sugere roupas que você pode gostar). A arquitetura TPU é otimizada para minimizar a movimentação de dados e a latência, o que, segundo o Google, resulta em economia de energia significativa.

A empresa planeja usar o Ironwood em seu cluster de computação modular AI Hypercomputer como parte do Google Cloud.

avalanche

Postagens recentes

IA na Vigia: As Perspectivas dos Data Centers Orbitais / Inteligência Artificial

No entanto, nem todos os especialistas estão dispostos a ver o espaço próximo como um…

49 minutos atrás

O novo assistente de IA da Adobe pode usar os aplicativos da Creative Cloud para executar tarefas.

Em outubro passado, a Adobe, como parte do Projeto Moonlight, apresentou um assistente de IA…

1 hora atrás

Invocação de criaturas, talismãs e novas armas épicas: uma grande atualização chegou para Titan Quest 2.

A editora THQ Nordic e os desenvolvedores do estúdio alemão Grimlore Games anunciaram o lançamento…

2 horas atrás

Invocação de criaturas, talismãs e novas armas épicas: uma grande atualização chegou para Titan Quest 2.

A editora THQ Nordic e os desenvolvedores do estúdio alemão Grimlore Games anunciaram o lançamento…

2 horas atrás

O Google lançou o aplicativo Gemini para macOS.

O Google lançou um aplicativo Gemini completo para computadores com o sistema operacional macOS da…

2 horas atrás

Cientistas chineses fizeram uma descoberta inovadora na gravação holográfica ultradensa.

Apesar das perspectivas promissoras, a gravação holográfica ainda não alcançou sucesso comercial. Gravar e decodificar…

3 horas atrás