A HPE lançou um supercomputador local para IA generativa

A HPE anunciou a disponibilidade de um sistema modular de supercomputação para IA generativa. A plataforma, destinada à colocação local na infraestrutura do cliente, é construída em superchips NVIDIA GH200 Grace Hopper.

A HPE anunciou a preparação do sistema em novembro de 2023. É baseado em servidores ProLiant DL380a Gen11. No total, podem ser usados ​​até 168 superchips GH200. Além disso, são utilizadas a plataforma NVIDIA Spectrum-X Ethernet e a DPU NVIDIA BlueField-3.

A solução é complementada pela plataforma de aprendizado de máquina e software de análise HPE, a plataforma NVIDIA AI Enterprise 5.0 para trabalhar com aplicativos de IA, que inclui microsserviços baseados em contêineres de software para download, bem como o serviço NVIDIA NeMo Retriever e outras bibliotecas para processamento de dados e IA. O sistema de supercomputadores destina-se a grandes empresas, institutos de pesquisa e agências governamentais.

Fonte da imagem: HPE

Afirma-se que em uma configuração com 16 nós, o complexo pode otimizar o modelo Llama 2 com 70 bilhões de parâmetros em apenas 6 minutos. O alto desempenho permite que os clientes melhorem a produtividade dos negócios com aplicações generativas de IA, como assistentes virtuais, chatbots inteligentes e ferramentas de pesquisa empresarial. Ao mesmo tempo, o software HPE Machine Learning Inference permitirá que as empresas implantem modelos de machine learning em larga escala com rapidez e segurança.

A HPE também anunciou sua intenção de lançar produtos de próxima geração usando soluções de hardware NVIDIA baseadas na arquitetura Blackwell. Estamos falando dos superchips híbridos GB200, bem como dos produtos HGX B200 e HGXB100. Detalhes sobre os novos sistemas serão revelados posteriormente.

avalanche

Postagens recentes

A Microsoft inundou milhares de solicitações de pull do GitHub com anúncios de IA — agora todas elas contêm “conselhos” idênticos do Copilot.

A Microsoft prometeu recentemente reduzir o uso excessivo de recursos de IA no Windows 11,…

24 minutos atrás

Um teste cego com cabos de áudio de US$ 4.250 e US$ 7 apresentou os resultados mais esperados.

Um teste cego realizado pela Audio Science Review confirmou mais uma vez que a única…

24 minutos atrás

A Microsoft anunciou uma grande apresentação de jogos, o Xbox Games Showcase 2026, e a primeira revelação de Gears of War: E-Day em dois anos.

A Microsoft, empresa americana detentora da plataforma, confirmou oficialmente a próxima apresentação de jogos da…

1 hora atrás

As autoridades russas planejam punir os usuários de VPN, inicialmente com sanções financeiras.

Em 28 de março, o chefe do Ministério do Desenvolvimento Digital, Maksut Shadayev, realizou reuniões…

2 horas atrás

A Microsoft recolheu a atualização mais recente do Windows 11 devido a arquivos ausentes ou corrompidos.

A insistência da Microsoft em incorporar IA em todos os seus produtos está colocando o…

2 horas atrás

A Microsoft vai melhorar significativamente a busca no Windows 11 após anos de reclamações.

A Microsoft confirmou um extenso trabalho de aprimoramento da Busca do Windows, após anos de…

2 horas atrás