A IBM criou um processador para IA de base analógica com baixo consumo de energia. Essa inovação poderia resolver o problema de alto consumo de energia associado a grandes modelos de linguagem, como o ChatGPT.

Fonte da imagem: ColiN00B/Pixabay

Os grandes modelos de linguagem por trás de tecnologias como ChatGPT são incrivelmente complexos. Eles contêm bilhões de nós de computação e exigem muitas conexões entre eles. Isso resulta em múltiplos acessos à memória e alto consumo de energia.

Uma maneira de resolver esse problema é combinar memória e unidades de processamento. A IBM e a Intel já desenvolveram chips que fornecem a cada neurônio a memória necessária para desempenhar suas funções. Uma alternativa a esta abordagem é realizar operações diretamente na memória, o que foi demonstrado usando memória de mudança de fase (memória de mudança de fase).

A IBM demonstrou um novo chip de memória de mudança de fase que está mais próximo de um processador funcional de IA. Em artigo publicado na Nature, a empresa mostrou que seu hardware pode realizar reconhecimento de fala com precisão aceitável e consumo de energia significativamente menor.

A memória de mudança de fase está em desenvolvimento há algum tempo. Ele combina a durabilidade da memória flash com desempenho comparável à RAM existente. Essa memória funciona aquecendo uma pequena área do material e controlando sua taxa de resfriamento.

Esse comportamento acabou sendo ideal para redes neurais. Nas redes neurais, cada nó recebe um sinal de entrada e, com base em seu estado, determina quanto desse sinal será repassado. Devido às propriedades da memória de mudança de fase, esta força pode ser representada como um único bit de memória operando em modo analógico.

Quando salvamos informações, elas usam dois estados principais – ligado e desligado. Esses estados são projetados para minimizar erros ao salvar dados. Porém, o interessante é que podemos configurar esta memória para assumir qualquer valor intermediário entre “on” e “off”, criando um comportamento analógico.

É como ajustar o volume da música, de baixo para alto, onde cada nível de volume representa um gradiente suave de valores potenciais. Assim, podemos usar esses valores intermediários para representar as diferentes “forças” ou importância das conexões nas redes neurais.

A IBM já demonstrou a eficácia desta abordagem. No entanto, o chip descrito está muito mais próximo de um processador funcional. Ele contém todo o conteúdo necessário para conectar nós individuais e funciona em uma escala próxima a grandes modelos de linguagem.

O principal componente do novo chip é o chamado bloco – um conjunto de cruzamentos (pense em uma grade quadrada) de bits individuais de memória de mudança de fase medindo 512 por 2.048 unidades. Cada chip contém 34 desses blocos, o que representa cerca de 35 milhões de bits de memória de mudança de fase.

A flexibilidade do processador permite controlar a força de qualquer conexão por um número variável de bits. Além disso, a comunicação entre chips é possível, permitindo que grandes tarefas sejam compartilhadas entre vários chips.

Para demonstrar o trabalho, os pesquisadores utilizaram um processador de reconhecimento de fala. Como resultado, foi capaz de realizar 12,4 trilhões de operações para cada watt de energia consumida em seu desempenho máximo. Isto é muitas vezes menor que o consumo de energia de um processador tradicional para realizar operações equivalentes.

Porém, é importante ressaltar que ele está otimizado para funcionar apenas com um determinado tipo de rede neural. Além disso, não é muito adequado para treinamento de IA, e o processo de treinamento da rede neural deve ser adaptado a este processador. Embora este processador não seja universal para IA, oferece uma redução significativa no consumo de energia.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *