Meio litro de água para cinquenta perguntas: servidores AI com ChatGPT consomem não apenas muita energia, mas também muita água para resfriamento

Embora alguns especialistas vejam muitas ameaças à humanidade em modelos generativos como GPT-4 ou Midjourney, nem todos prestam atenção a um fator importante – é possível que em breve a IA e as pessoas compitam por água doce comum. Segundo o The Register, de acordo com os cientistas, será cada vez mais necessário resfriar o data center.

O problema atraiu a atenção de cientistas da Universidade da Califórnia em Riverside e da Universidade do Texas em Arlington. Os pesquisadores estimam que aprender um modelo de linguagem GPT-3 requer o uso de cerca de 700.000 litros de água – a mesma quantidade gasta na produção de 320 veículos elétricos da Tesla. Além disso, um simples diálogo de 20 a 50 perguntas do ChatGPT requer cerca de 500 ml de água e, com o desenvolvimento da IA, o consumo de água desses sistemas atingirá proporções enormes – se não forem tomadas medidas para otimizar o resfriamento do data center com antecedência.

Fonte da imagem: Drew Dizzy Graham/unsplash.com

Ao mesmo tempo, especialistas prometem que, em meados do século, vastos territórios nos Estados Unidos sofrerão com a seca. Os data centers já estão extremamente relutantes em compartilhar informações sobre o consumo de água, enquanto usam diferentes sistemas de contagem e, como o Google, tentam esconder vestígios no tribunal. Como resultado, os cientistas precisam usar principalmente dados indiretos em seus cálculos. No entanto, argumenta-se que é possível usar o modelo desenvolvido pela SPX Cooling Technologies em qualquer lugar e isso determinará quanta água será gasta em modelos de treinamento e linguagem operacional.

Existem muitas opções disponíveis, desde ar a água ou resfriamento por imersão, cada uma com suas próprias vantagens e desvantagens. No entanto, fornecedores como Submer e LiquidStack oferecem sistemas de resfriamento por imersão que fornecem PUEs inferiores a 1,05, enquanto os sistemas refrigerados a ar geralmente fornecem apenas 1,4-1,5.

Fonte da imagem: redcharlie | @redcharlie1/unsplash.com

O trabalho científico fornece não apenas maneiras possíveis de otimizar os sistemas de resfriamento, mas também recomendações para que os data centers gerem menos calor em princípio. Em particular, estamos falando sobre o fato de que os data centers devem ser construídos em locais com clima frio, em vez de países asiáticos quentes, e algumas tarefas podem ser realizadas à tarde, quando fica mais frio. Embora isso limite o uso de células solares, a conclusão óbvia é usar fontes de bateria de backup em vez de geradores para armazenamento de energia durante o dia.

Os cientistas acreditam que a chave para o uso eficiente de sistemas de energia e refrigeração é uma maior transparência nas atividades do data center. Na Europa, por exemplo, as emendas à Diretiva de Eficiência Energética estão sendo revisadas, o que forçará todos, exceto os menores data centers, a relatar muitos parâmetros. Como afirmou um cientista, “A indústria de data centers é tão secreta que às vezes é difícil obter os dados certos para construir modelos”. No entanto, os cientistas temem que os hiperescaladores possam não ter tempo suficiente para implementar relatórios de alta qualidade – a indústria de IA está se desenvolvendo muito rapidamente.

avalanche

Postagens recentes

“Sims, seus dias estão contados”: novas imagens de jogabilidade do ambicioso simulador de vida Paralives impressionaram os fãs do gênero.

A desenvolvedora canadense Paralives Studio revelou um novo trailer de jogabilidade e imagens ampliadas do…

25 minutos atrás

Até 84 núcleos e 384 MB de cache L3: a AMD divulga detalhes sobre seus processadores de telecomunicações EPYC 8005 (Sorano).

Em fevereiro, a AMD anunciou os processadores EPYC 8005, codinome Sorano, para equipamentos de telecomunicações,…

38 minutos atrás

A Samsung anunciou o lançamento de novos monitores Odyssey e ViewFinity, com resolução de até 6K.

A Samsung anunciou o lançamento de novos monitores gamer da linha Odyssey, além de modelos…

1 hora atrás

TPUs “desvinculadas do Google”: Blackstone e Google implantarão nuvem de 500 MW com aceleradores de IA proprietários do Google, sem o Google Cloud.

A Blackstone e o Google formaram uma joint venture para construir uma nova plataforma de…

1 hora atrás

A Microsoft está abandonando a autenticação de dois fatores por SMS em favor de chaves de acesso.

Segundo o Windows Latest, a Microsoft planeja eliminar gradualmente a autenticação por SMS para contas…

2 horas atrás