Meio milhão de aceleradores Trainium2: a AWS implementa um dos maiores clusters de IA do Project Rainier do mundo para a Anthropic.

A AWS anunciou o lançamento do Project Rainier, um dos maiores clusters de IA do mundo. Este ambicioso projeto é essencialmente um supercomputador de IA distribuído por vários data centers — um marco importante no compromisso da AWS com o desenvolvimento de infraestrutura de IA, de acordo com o serviço de imprensa da Amazon. A plataforma foi criada especificamente para a Anthropic, que recentemente assinou um contrato multimilionário para usar TPUs do Google.

A AWS colaborou com a startup Anthropic no Project Rainier. O projeto utiliza aproximadamente 500.000 chips Tranium2, oferecendo cinco vezes mais poder computacional do que a Anthropic usava para treinar modelos de IA anteriores. A Anthropic está usando o Project Rainier para criar e implantar modelos da família Claude. Até o final de 2025, a empresa espera usar mais de um milhão de chips Tranium2 para treinamento e inferência.

Como parte do Project Rainier, a AWS já construiu uma infraestrutura baseada em Tranium2 que é 70% mais rápida do que qualquer outra plataforma de computação de IA na história da AWS. O projeto abrange vários data centers nos EUA e é único entre as iniciativas da AWS. É concebido como um gigantesco cluster EC2 UltraCluster de UltraServers Trainium2. Um UltraServer compreende quatro servidores físicos, cada um com 16 chips Trainium2. Eles se comunicam por meio da interconexão proprietária NeuronLink, que fornece conexões rápidas dentro do sistema, acelerando significativamente a computação em todos os 64 chips. Dezenas de milhares de UltraServers são conectados em um UltraCluster por meio de uma malha EFA.

Fonte da imagem: AWS

Operar um data center desse porte exige maior confiabilidade. Ao contrário da maioria dos provedores de nuvem, a AWS constrói seu próprio hardware e controla todos os componentes, desde chips e sistemas de refrigeração até toda a arquitetura do data center. As equipes de gerenciamento de data centers dedicam especial atenção à eficiência energética, desde o layout dos racks até a distribuição de energia e a seleção dos métodos de refrigeração. Além disso, a partir de 2023, todo o consumo de energia da Amazon será compensado por eletricidade proveniente de fontes renováveis. A Amazon afirma ser a maior compradora de energia renovável nos últimos cinco anos e está comprometida em atingir emissões líquidas zero até 2040.

Fonte da imagem: AWS

Bilhões de dólares estão sendo investidos em energia nuclear e baterias, bem como em grandes projetos de energia renovável para data centers. Em 2024, a empresa anunciou o lançamento de novos componentes para data centers que combinam tecnologias de energia, refrigeração e hardware, não apenas para novas construções, mas também para instalações existentes. Espera-se que os novos componentes reduzam o consumo de energia de alguns componentes em até 46% e a pegada de carbono do concreto em 35%.

Fonte da imagem: AWS

Espera-se que as novas instalações construídas dentro e fora do Projeto Rainier utilizem uma série de novas tecnologias para melhorar a eficiência energética e a sustentabilidade. Algumas dessas tecnologias estão relacionadas à eficiência hídrica. A AWS projeta suas instalações para usar o mínimo de água possível, ou nenhuma. Uma das abordagens é eliminar a água dos sistemas de refrigeração em muitas instalações durante a maior parte do ano, optando pela refrigeração com ar externo.

Por exemplo, uma instalação do Projeto Rainier em Indiana utilizará ar externo o máximo possível e, de outubro a março, os data centers não usarão água para refrigeração. De abril a setembro, a água será usada por uma média de várias horas por dia. De acordo com um relatório do Laboratório Nacional Lawrence Berkeley (LBNL), o WUE (consumo de água por unidade) típico para data centers é de 0,375 l/kWh. Na AWS, esse valor é de 0,15 l/kWh, uma melhoria de 40% em relação ao valor de 2021.

Se você notar algum erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você pode melhorar? Ficaremos felizes em receber seu feedback.

Fonte:

admin

Postagens recentes

OpenAI adiciona recursos como Cameos e fusão de vídeos ao Sora (3DNews)

O aplicativo OpenAI Sora agora permite criar séries de vídeos gerados por IA com um…

1 hora atrás

Rumor: Amazon cancela mais um MMO de Senhor dos Anéis (3DNews)

Anunciado em maio de 2023, o ambicioso RPG multijogador baseado na franquia de fantasia O…

2 horas atrás

A Yandex está desenvolvendo um gravador de voz inteligente com tecnologia Alice Pro, que transcreverá gravações automaticamente.

A Yandex anunciou seu primeiro dispositivo com inteligência artificial — um gravador de voz inteligente…

2 horas atrás

Os japoneses aprenderam a cultivar diamantes sem temperaturas e pressões extremas, mas em tamanhos muito pequenos. 3DNews

Cientistas da Universidade de Tóquio fizeram uma descoberta revolucionária na síntese de diamantes em nanoescala.…

2 horas atrás

A Xiaomi ensinou um de seus smartphones a rodar jogos de PC da Steam (3DNews).

A Xiaomi lançou uma atualização para o seu aplicativo Game Center, que agora permite jogar…

2 horas atrás