A IBM desenvolveu um chip de IA com armazenamento interno de dados e é uma ordem de magnitude mais rápida que os aceleradores Nvidia

A IBM anunciou que concluiu os testes de um novo protótipo de processador para tarefas de inteligência artificial. O novo desenvolvimento, codinome NorthPole, provou ser 4.000 vezes melhor do que a arquitetura de IA anterior da empresa, chamada TrueNorth, e superou “de tirar o fôlego” todos os processadores centrais e gráficos mais avançados.

Processador IBM NorthPole em uma placa PCIe. Fonte da imagem: IBM

O chip NorthPole é fabricado com tecnologia de processo de 12 nm e contém 22 bilhões de transistores em uma área de 800 mm2. Na verdade, esta é uma “rede em um chip” – este processador contém 256 núcleos com uma interface extensa e memória interna. É graças à memória incorporada no chip que foi possível alcançar o melhor desempenho da indústria em termos de eficiência energética, redução de latência e área efetiva.

Em um ciclo de clock, o processador NorthPole executa 2.048 operações por núcleo (com precisão de 8 bits). Para precisão de 4 e 2 bits, o número de operações executadas é duplicado e quadruplicado, respectivamente. Essa habilidade visa principalmente o processamento de imagens. Mais precisamente, para visão mecânica digital, e estes são pilotos automáticos, autocirurgiões e assim por diante.

O gargalo da arquitetura von Neumann foi e continua sendo a separação entre memória e processador. Os desenvolvedores da IBM superaram esse obstáculo quando criaram um processador que armazena todos os dados dentro de si, sem enviá-los para dispositivos de armazenamento externos.

Os testes no modelo ResNet50, uma rede neural de 50 camadas para testar soluções de reconhecimento e classificação de imagens, mostraram que a eficiência energética do chip NorthPole é 25 vezes maior do que a eficiência energética das GPUs convencionais de 12 nm e CPUs de 14 nm. Além disso, os indicadores de latência foram 22 vezes melhores, sendo inferiores para o chip IBM. Os desenvolvedores chamaram isso de resultado “alucinante”. Finalmente, em termos de utilização da área do chip (número de transistores), a arquitetura da IBM também superou todos os concorrentes, incluindo até GPUs de 4nm.

avalanche

Postagens recentes

Análise do Ryzen 9 9950X3D2: Um processador de 16 núcleos com cache 3D / Processadores e Memória

Quando a AMD começou a migrar a tecnologia 3D V-Cache para seus processadores Ryzen de…

5 horas atrás

A NASA apresentou o Pegasus, um novo veículo explorador projetado para explorar a Lua.

A Administração Nacional da Aeronáutica e Espaço dos Estados Unidos (NASA) busca construir um assentamento…

9 horas atrás

A NASA apresentou o Pegasus, um novo veículo explorador projetado para explorar a Lua.

A Administração Nacional da Aeronáutica e Espaço dos Estados Unidos (NASA) busca construir um assentamento…

9 horas atrás

“Ocorreu uma falha”: um carro da Tesla com o Autopilot ativado colidiu com a porta de uma garagem.

Um proprietário de um Tesla do estado de Washington (EUA) literalmente invadiu a garagem de…

12 horas atrás

Os bloqueadores de anúncios continuarão funcionando no Google Chrome após o fim do suporte ao Manifest V2.

Esta semana, veículos de comunicação noticiaram a intenção do Google de abandonar o suporte ao…

12 horas atrás

Físicos lançaram um relógio nuclear pela primeira vez – ele pode superar os relógios atômicos em precisão e auxiliar na busca por matéria escura.

Um grupo de físicos demonstrou pela primeira vez um relógio nuclear funcional — um dispositivo…

13 horas atrás