Reserva de IA: AWS convida clientes a pré-encomendar clusters com aceleradores NVIDIA H100

O provedor de nuvem Amazon Web Services (AWS) anunciou o lançamento de um novo modelo de consumo, EC2 Capacity Blocks for ML, projetado para empresas que buscam reservar acesso a aceleradores de computação para lidar com cargas de trabalho de IA de curta duração.

A solução EC2 Capacity Blocks para ML da Amazon permite que os clientes reservem acesso a “centenas” de aceleradores NVIDIA H100 em EC2 UltraClusters, que são projetados para cargas de trabalho de aprendizado de máquina de alto desempenho. Os clientes simplesmente especificam o tamanho do cluster desejado e as datas de início e término do acesso. Isto aumenta a previsibilidade da disponibilidade de recursos de IA, ao mesmo tempo que elimina a necessidade de pagar pelo acesso à capacidade quando esta não está em utilização. A AWS também se beneficia porque essa abordagem faz melhor uso dos recursos existentes.

Fonte da imagem: AWS

O EC2 Capacity Blocks oferece clusters de 1 a 64 instâncias EC2 P5 com conectividade Elastic Fabric Adapter (EFA) de segunda geração. Os clusters podem ser reservados por um período de 1 a 14 dias, mas no máximo com oito semanas de antecedência. Isso os torna ideais para treinar e ajustar modelos de IA, experimentos de curto prazo ou para lidar com volumes de pico de demanda, como no lançamento de um novo produto, disse a AWS.

Holger Mueller, analista da Constellation Research Inc., observou que a abordagem criativa da AWS maximiza a eficiência dos recursos de aceleradores existentes, que estão atualmente em pico de demanda e cujo acesso é caro. Segundo ele, a abordagem é emprestada da era do mainframe e foi utilizada pela primeira vez na década de 1970, quando o acesso era distribuído ao longo do tempo entre centenas de usuários com diferentes cargas de trabalho.

Os clientes podem usar o console AWS, CLI ou SDK para encontrar e reservar clusters disponíveis. Com os Blocos de Capacidade EC2, os clientes pagam apenas pelo tempo que reservam. A solução está disponível na região AWS Leste dos EUA (Ohio). Expandiremos o número de regiões e locais da AWS com esta solução disponível no futuro.

avalanche

Postagens recentes

“Ocorreu uma falha”: um carro da Tesla com o Autopilot ativado colidiu com a porta de uma garagem.

Um proprietário de um Tesla do estado de Washington (EUA) literalmente invadiu a garagem de…

3 horas atrás

Os bloqueadores de anúncios continuarão funcionando no Google Chrome após o fim do suporte ao Manifest V2.

Esta semana, veículos de comunicação noticiaram a intenção do Google de abandonar o suporte ao…

4 horas atrás

Físicos lançaram um relógio nuclear pela primeira vez – ele pode superar os relógios atômicos em precisão e auxiliar na busca por matéria escura.

Um grupo de físicos demonstrou pela primeira vez um relógio nuclear funcional — um dispositivo…

5 horas atrás

A Colt e a Ciena testam com sucesso um link transatlântico “pós-quântico” de 800 Gbps.

A Colt Technology Services e a Ciena concluíram com sucesso a transferência de dados protegida…

6 horas atrás

O Reino Unido vai investir US$ 1 bilhão em um supercomputador de IA com chips britânicos.

O governo do Reino Unido anunciou o Plano de Hardware de IA do Reino Unido.…

8 horas atrás