A IBM desenvolveu um chip de IA com armazenamento interno de dados e é uma ordem de magnitude mais rápida que os aceleradores Nvidia

A IBM anunciou que concluiu os testes de um novo protótipo de processador para tarefas de inteligência artificial. O novo desenvolvimento, codinome NorthPole, provou ser 4.000 vezes melhor do que a arquitetura de IA anterior da empresa, chamada TrueNorth, e superou “de tirar o fôlego” todos os processadores centrais e gráficos mais avançados.

Processador IBM NorthPole em uma placa PCIe. Fonte da imagem: IBM

O chip NorthPole é fabricado com tecnologia de processo de 12 nm e contém 22 bilhões de transistores em uma área de 800 mm2. Na verdade, esta é uma “rede em um chip” – este processador contém 256 núcleos com uma interface extensa e memória interna. É graças à memória incorporada no chip que foi possível alcançar o melhor desempenho da indústria em termos de eficiência energética, redução de latência e área efetiva.

Em um ciclo de clock, o processador NorthPole executa 2.048 operações por núcleo (com precisão de 8 bits). Para precisão de 4 e 2 bits, o número de operações executadas é duplicado e quadruplicado, respectivamente. Essa habilidade visa principalmente o processamento de imagens. Mais precisamente, para visão mecânica digital, e estes são pilotos automáticos, autocirurgiões e assim por diante.

O gargalo da arquitetura von Neumann foi e continua sendo a separação entre memória e processador. Os desenvolvedores da IBM superaram esse obstáculo quando criaram um processador que armazena todos os dados dentro de si, sem enviá-los para dispositivos de armazenamento externos.

Os testes no modelo ResNet50, uma rede neural de 50 camadas para testar soluções de reconhecimento e classificação de imagens, mostraram que a eficiência energética do chip NorthPole é 25 vezes maior do que a eficiência energética das GPUs convencionais de 12 nm e CPUs de 14 nm. Além disso, os indicadores de latência foram 22 vezes melhores, sendo inferiores para o chip IBM. Os desenvolvedores chamaram isso de resultado “alucinante”. Finalmente, em termos de utilização da área do chip (número de transistores), a arquitetura da IBM também superou todos os concorrentes, incluindo até GPUs de 4nm.

avalanche

Postagens recentes

Protótipos do trem elétrico mais rápido do mundo apresentados na China

No fim de semana passado, um protótipo do trem elétrico de alta velocidade CR450 foi…

18 segundos atrás

RAM ficará mais barata no início de 2025

Os preços da memória DRAM convencional diminuirão de 8 a 13% e, levando em consideração…

1 hora atrás

Entusiastas rodaram o moderno modelo de IA Llama em um PC antigo com Pentium II e Windows 98

Especialistas do EXO Labs conseguiram executar um Llama de modelo de linguagem grande (LLM) bastante…

1 hora atrás

A Xiaomi lançou um banco de potência compacto de 20.000 mAh com um cabo USB-C integrado por US$ 22

A evolução dos dispositivos móveis impõe exigências especiais às características das baterias externas: devem ter…

3 horas atrás

Moore Threads lançou uma placa de vídeo profissional MTT X300 baseada em uma poderosa GPU chinesa

O fabricante chinês de GPU Moore Threads apresentou a placa gráfica profissional MTT X300, voltada…

3 horas atrás