A IBM desenvolveu um processador analógico com eficiência energética para IA

A IBM criou um processador para IA de base analógica com baixo consumo de energia. Essa inovação poderia resolver o problema de alto consumo de energia associado a grandes modelos de linguagem, como o ChatGPT.

Fonte da imagem: ColiN00B/Pixabay

Os grandes modelos de linguagem por trás de tecnologias como ChatGPT são incrivelmente complexos. Eles contêm bilhões de nós de computação e exigem muitas conexões entre eles. Isso resulta em múltiplos acessos à memória e alto consumo de energia.

Uma maneira de resolver esse problema é combinar memória e unidades de processamento. A IBM e a Intel já desenvolveram chips que fornecem a cada neurônio a memória necessária para desempenhar suas funções. Uma alternativa a esta abordagem é realizar operações diretamente na memória, o que foi demonstrado usando memória de mudança de fase (memória de mudança de fase).

A IBM demonstrou um novo chip de memória de mudança de fase que está mais próximo de um processador funcional de IA. Em artigo publicado na Nature, a empresa mostrou que seu hardware pode realizar reconhecimento de fala com precisão aceitável e consumo de energia significativamente menor.

A memória de mudança de fase está em desenvolvimento há algum tempo. Ele combina a durabilidade da memória flash com desempenho comparável à RAM existente. Essa memória funciona aquecendo uma pequena área do material e controlando sua taxa de resfriamento.

Esse comportamento acabou sendo ideal para redes neurais. Nas redes neurais, cada nó recebe um sinal de entrada e, com base em seu estado, determina quanto desse sinal será repassado. Devido às propriedades da memória de mudança de fase, esta força pode ser representada como um único bit de memória operando em modo analógico.

Quando salvamos informações, elas usam dois estados principais – ligado e desligado. Esses estados são projetados para minimizar erros ao salvar dados. Porém, o interessante é que podemos configurar esta memória para assumir qualquer valor intermediário entre “on” e “off”, criando um comportamento analógico.

É como ajustar o volume da música, de baixo para alto, onde cada nível de volume representa um gradiente suave de valores potenciais. Assim, podemos usar esses valores intermediários para representar as diferentes “forças” ou importância das conexões nas redes neurais.

A IBM já demonstrou a eficácia desta abordagem. No entanto, o chip descrito está muito mais próximo de um processador funcional. Ele contém todo o conteúdo necessário para conectar nós individuais e funciona em uma escala próxima a grandes modelos de linguagem.

O principal componente do novo chip é o chamado bloco – um conjunto de cruzamentos (pense em uma grade quadrada) de bits individuais de memória de mudança de fase medindo 512 por 2.048 unidades. Cada chip contém 34 desses blocos, o que representa cerca de 35 milhões de bits de memória de mudança de fase.

A flexibilidade do processador permite controlar a força de qualquer conexão por um número variável de bits. Além disso, a comunicação entre chips é possível, permitindo que grandes tarefas sejam compartilhadas entre vários chips.

Para demonstrar o trabalho, os pesquisadores utilizaram um processador de reconhecimento de fala. Como resultado, foi capaz de realizar 12,4 trilhões de operações para cada watt de energia consumida em seu desempenho máximo. Isto é muitas vezes menor que o consumo de energia de um processador tradicional para realizar operações equivalentes.

Porém, é importante ressaltar que ele está otimizado para funcionar apenas com um determinado tipo de rede neural. Além disso, não é muito adequado para treinamento de IA, e o processo de treinamento da rede neural deve ser adaptado a este processador. Embora este processador não seja universal para IA, oferece uma redução significativa no consumo de energia.

avalanche

Postagens recentes

A Microsoft iniciou os testes do upscaler universal Auto SR para Windows 11 – atualmente apenas no Xbox Ally X.

A Microsoft começou a testar o recurso de upscaling Auto SR no console portátil Xbox…

19 minutos atrás

O assistente de IA Gemini estará presente em milhões de carros com tecnologia Google.

O Google começou a se preparar para atualizar seus veículos com o Google Assistente integrado,…

32 minutos atrás

A Noctua explica por que as ventoinhas pretas são lançadas depois das ventoinhas padrão bege-marrom.

A Noctua explicou por que seus ventiladores da série chromax.black costumam chegar às prateleiras meses…

1 hora atrás

O Google está pronto para exibir anúncios no Gemini; a OpenAI já faz isso no ChatGPT.

A direção do Google confirmou sua disposição em integrar publicidade ao aplicativo Gemini, abandonando a…

1 hora atrás

Um trailer atmosférico revela a data de acesso antecipado de Subnautica 2 – a espera não será longa.

Os desenvolvedores do estúdio americano Unknown Worlds Entertainment, pertencente à Krafton, finalmente anunciaram a data…

1 hora atrás

A Samsung alertou que a escassez de memória RAM pode piorar ainda mais em 2027.

A Samsung está confiante de que a grave escassez de memória causada pela demanda dos…

2 horas atrás