O Google descobriu como acelerar o treinamento de IA em 13 vezes e reduzir o consumo de energia em 10 vezes

O Google DeepMind desenvolveu um novo método de treinamento de inteligência artificial que promete melhorar significativamente a eficiência dos sistemas de IA e reduzir o consumo de energia na área de IA. A tecnologia pode ser a resposta às crescentes preocupações sobre o impacto ambiental dos data centers de IA.

Fonte da imagem: Google DeepMind

O JEST difere das abordagens tradicionais porque aprende com lotes inteiros de dados, em vez de partes individuais. O JEST primeiro constrói um modelo de IA menor que avalia a qualidade dos dados das fontes e classifica os pacotes por qualidade. Em seguida, compara sua pontuação com um conjunto de qualidade inferior. O JEST então determina quais pacotes são mais adequados para treinamento e, então, o modelo maior é treinado com base nos melhores dados selecionados pelo modelo menor.

Um fator chave para o sucesso do JEST é o uso de conjuntos de dados cuidadosamente selecionados e de alta qualidade. Isto torna o método particularmente exigente em termos de informação inicial e pode limitar a sua utilização por amadores e desenvolvedores não profissionais.

Curiosamente, o surgimento do JEST coincidiu com preocupações crescentes sobre o consumo de energia dos sistemas de IA. Segundo os investigadores, as cargas de trabalho de IA consumiram cerca de 4,3 GW de eletricidade em 2023, o que é comparável ao consumo anual de Chipre. Além disso, uma única consulta ChatGPT consome 10 vezes mais energia do que uma consulta de pesquisa do Google.

Os especialistas observam que a nova tecnologia pode ser usada de duas maneiras: para reduzir o consumo de energia, mantendo o desempenho atual, ou para alcançar a produtividade máxima com o mesmo nível de consumo de energia. A escolha da direção dependerá das prioridades da empresa e das tendências do mercado.

A implementação do JEST poderá ter um impacto significativo na indústria de IA, dado o alto custo de treinamento dos modelos atuais. Por exemplo, os custos de formação para o GPT-4 são estimados em 100 milhões de dólares e os modelos futuros poderão exigir investimentos ainda maiores. Assim, o método JEST apresentado pelo Google DeepMind abre oportunidades fundamentalmente novas para aumentar a eficiência e reduzir custos na tecnologia de IA. A aplicação prática do método ainda precisa ser avaliada.

avalanche

Postagens recentes

O YouTube tem bombardeado alguns usuários com testes CAPTCHA antes de assistirem aos vídeos.

Alguns usuários do YouTube têm encontrado dificuldades ao usar o site devido a um CAPTCHA…

4 horas atrás

A Nvidia lançou uma atualização de driver para corrigir travamentos em Arknights: Endfield.

A Nvidia lançou a versão 596.02 do driver de correção (hotfix). Ela é baseada no…

5 horas atrás

Um horror ancestral desperta no trailer de jogabilidade de Cthulhu: The Cosmic Abyss, um jogo de terror e investigação baseado nas obras de H.P. Lovecraft.

A desenvolvedora Big Bad Wolf, com o apoio da Nacon, revelou um trailer de jogabilidade…

6 horas atrás

A MaxSun apresentou suas variantes do Arc Pro B70, com resfriamento ativo e passivo.

A MaxSun tornou-se a primeira parceira da Intel a anunciar suas variantes da placa gráfica…

7 horas atrás

A ASRock apresentou a placa-mãe Z890 Taichi 10th Anniversary com um design atualizado.

A ASRock apresentou a placa-mãe Z890 Taichi 10th Anniversary, projetada para celebrar o 10º aniversário…

7 horas atrás