A AWS anunciou o lançamento do Project Rainier, um dos maiores clusters de IA do mundo. Este ambicioso projeto é essencialmente um supercomputador de IA distribuído por vários data centers — um marco importante no compromisso da AWS com o desenvolvimento de infraestrutura de IA, de acordo com o serviço de imprensa da Amazon. A plataforma foi criada especificamente para a Anthropic, que recentemente assinou um contrato multimilionário para usar TPUs do Google.
A AWS colaborou com a startup Anthropic no Project Rainier. O projeto utiliza aproximadamente 500.000 chips Tranium2, oferecendo cinco vezes mais poder computacional do que a Anthropic usava para treinar modelos de IA anteriores. A Anthropic está usando o Project Rainier para criar e implantar modelos da família Claude. Até o final de 2025, a empresa espera usar mais de um milhão de chips Tranium2 para treinamento e inferência.
Como parte do Project Rainier, a AWS já construiu uma infraestrutura baseada em Tranium2 que é 70% mais rápida do que qualquer outra plataforma de computação de IA na história da AWS. O projeto abrange vários data centers nos EUA e é único entre as iniciativas da AWS. É concebido como um gigantesco cluster EC2 UltraCluster de UltraServers Trainium2. Um UltraServer compreende quatro servidores físicos, cada um com 16 chips Trainium2. Eles se comunicam por meio da interconexão proprietária NeuronLink, que fornece conexões rápidas dentro do sistema, acelerando significativamente a computação em todos os 64 chips. Dezenas de milhares de UltraServers são conectados em um UltraCluster por meio de uma malha EFA.

Fonte da imagem: AWS
Operar um data center desse porte exige maior confiabilidade. Ao contrário da maioria dos provedores de nuvem, a AWS constrói seu próprio hardware e controla todos os componentes, desde chips e sistemas de refrigeração até toda a arquitetura do data center. As equipes de gerenciamento de data centers dedicam especial atenção à eficiência energética, desde o layout dos racks até a distribuição de energia e a seleção dos métodos de refrigeração. Além disso, a partir de 2023, todo o consumo de energia da Amazon será compensado por eletricidade proveniente de fontes renováveis. A Amazon afirma ser a maior compradora de energia renovável nos últimos cinco anos e está comprometida em atingir emissões líquidas zero até 2040.

Fonte da imagem: AWS
Bilhões de dólares estão sendo investidos em energia nuclear e baterias, bem como em grandes projetos de energia renovável para data centers. Em 2024, a empresa anunciou o lançamento de novos componentes para data centers que combinam tecnologias de energia, refrigeração e hardware, não apenas para novas construções, mas também para instalações existentes. Espera-se que os novos componentes reduzam o consumo de energia de alguns componentes em até 46% e a pegada de carbono do concreto em 35%.

Fonte da imagem: AWS
Espera-se que as novas instalações construídas dentro e fora do Projeto Rainier utilizem uma série de novas tecnologias para melhorar a eficiência energética e a sustentabilidade. Algumas dessas tecnologias estão relacionadas à eficiência hídrica. A AWS projeta suas instalações para usar o mínimo de água possível, ou nenhuma. Uma das abordagens é eliminar a água dos sistemas de refrigeração em muitas instalações durante a maior parte do ano, optando pela refrigeração com ar externo.
Por exemplo, uma instalação do Projeto Rainier em Indiana utilizará ar externo o máximo possível e, de outubro a março, os data centers não usarão água para refrigeração. De abril a setembro, a água será usada por uma média de várias horas por dia. De acordo com um relatório do Laboratório Nacional Lawrence Berkeley (LBNL), o WUE (consumo de água por unidade) típico para data centers é de 0,375 l/kWh. Na AWS, esse valor é de 0,15 l/kWh, uma melhoria de 40% em relação ao valor de 2021.
Se você notar algum erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você pode melhorar? Ficaremos felizes em receber seu feedback.
Fonte:
