O desenvolvedor de soluções de IA generativa, MosaicML, recentemente adquirido pela Databricks, relatou bons resultados no treinamento de modelos de linguagem grande (LLMs) usando os aceleradores AMD Instinct MI250 e sua própria plataforma.
A empresa disse que está procurando um novo hardware de aprendizado de máquina em nome de seus clientes, já que a NVIDIA atualmente não pode fornecer seus aceleradores a todos. MosaicML explicou que os requisitos para tais chips são simples:
Fonte da imagem: MosaicML
Como a empresa observou, nenhum dos chips até o momento foi capaz de satisfazer totalmente todos os requisitos do MosaicML. No entanto, com o lançamento de versões atualizadas da estrutura PyTorch 2.0 e da plataforma ROCm 5.4+, a situação mudou – o treinamento LLM tornou-se possível nos aceleradores AMD Instinct MI250 sem alterações de código ao usar sua pilha LLM Foundry.
Alguns destaques:
No entanto, nenhuma alteração no código foi necessária.
Todos os resultados são de um nó de quatro MI250s, mas a empresa está trabalhando com hiperescaladores para testar os recursos de aprendizado em clusters AMD Instinct maiores. “No geral, nossos testes iniciais mostraram que a AMD criou uma pilha de hardware e software eficiente e fácil de usar que pode competir com a NVIDIA”, disse MosaicML. Este é um passo importante na luta contra o domínio da NVIDIA no mercado de IA.
Em março de 2017, a AMD lançou sua arquitetura Zen e os primeiros processadores Ryzen,…
A Samsung prometeu corrigir em breve os problemas com a tela do Galaxy S26 Ultra,…
A MSI apresentou oficialmente a poderosa estação de trabalho XpertStation WS300, focada em IA. O…
A Apple começou a enviar notificações para proprietários de iPhones e iPads com versões antigas…
O Google anunciou uma aceleração drástica em seu cronograma de segurança para infraestrutura de computação…
A Agência Espacial Europeia (ESA) anunciou o lançamento bem-sucedido dos dois primeiros satélites da missão…