Os requisitos de hardware de grandes modelos de linguagem de IA são reduzidos pela metade a cada oito meses

Os grandes modelos de linguagem que alimentam os chatbots de IA estão avançando tão rapidamente que, em apenas oito meses, os recursos de hardware necessários para funcionar foram reduzidos pela metade – os próprios chips estão fazendo um progresso muito mais modesto.

Fonte da imagem: Gerd Altmann / pixabay.com

Existem duas maneiras de melhorar o desempenho dos sistemas de IA, observa Tamay Besiroglu, pesquisador do MIT: aumentar o tamanho de grandes modelos de linguagem, o que exigirá um aumento proporcional no poder de computação, embora o hardware de IA seja atualmente escasso; ou otimizar algoritmos subjacentes para fazer uso mais eficiente do hardware existente. Os atuais desenvolvedores de grandes modelos de linguagem parecem preferir a segunda abordagem.

Os cientistas analisaram o desempenho de 231 grandes modelos de linguagem desenvolvidos entre 2012 e 2023 e descobriram que a capacidade computacional necessária para executá-los caiu pela metade a cada oito meses, em média. Isto é significativamente mais rápido do que a Lei de Moore empírica, que afirma que o número de transistores num chip (uma medida do seu desempenho) duplica a cada 18 a 24 meses. Os investigadores observam que este aumento no desempenho dos sistemas de IA se deve em parte à otimização do código, embora isto não possa ser determinado com precisão porque os algoritmos de IA muitas vezes não podem ser analisados. O desenvolvimento de componentes de hardware, é claro, também desempenhou um papel importante.

A diferença nas taxas de desenvolvimento é um indicador da eficácia com que os desenvolvedores de grandes modelos de linguagem utilizam os recursos disponíveis. Não será possível otimizar algoritmos indefinidamente, acredita Besiroglou, e não está claro se esse ritmo de desenvolvimento continuará no longo prazo. Há também preocupações de que melhorar a eficiência dos modelos possa, pelo contrário, aumentar o consumo de energia da indústria de IA, pelo que é impossível focar apenas num aspecto e ignorar o resto, alertam os cientistas.

avalanche

Postagens recentes

Estudo: 9 em cada 10 dicas financeiras de blogueiros foram consideradas ruins – mas as pessoas ainda ficaram satisfeitas.

Segundo um estudo realizado no Reino Unido, os conselhos de influenciadores financeiros nas redes sociais…

5 horas atrás

Agora você pode programar em qualquer lugar: o ChatGPT para smartphones agora tem o Codex.

A OpenAI aprimorou o aplicativo móvel ChatGPT para desenvolvedores que trabalham em qualquer lugar, adicionando…

5 horas atrás

A Samsung iniciou cortes emergenciais na produção em antecipação a uma greve em massa.

A Samsung Electronics está se preparando para uma greve geral de 18 dias, planejada pelos…

5 horas atrás

A Cerebras realizou o maior IPO deste ano, com as ações da concorrente da Nvidia disparando 68% no primeiro dia.

As ações da Cerebras Systems, que começaram a ser negociadas ontem na bolsa Nasdaq, fecharam…

6 horas atrás

A Hobot lançou o robô de limpeza de janelas Hobot SP10, equipado com raspadores móveis para resultados impecáveis.

A HOBOT lançou o robô de limpeza de janelas Hobot SP10, o primeiro do setor…

6 horas atrás

A JCB apresenta o Hydromax, um caminhão de corrida movido a hidrogênio com 1.200 cavalos de potência, projetado para quebrar recordes.

Recentemente, a empresa britânica JCB apresentou o Hydromax, um veículo de alta velocidade movido a…

6 horas atrás