Llama 2 está em boas mãos: Dell e Meta ofereceram um sistema de software e hardware pronto para implantação local de IA

Dell e Meta✴ propuseram um desenvolvimento conjunto para melhorar a eficiência das empresas na área de IA generativa, com base no uso do grande modelo de linguagem Meta✴ Llama 2 e da infraestrutura Dell.

O lançamento de aplicações generativas de IA, como chatbots, assistentes virtuais, inclusive para escrita de código, envolve modelos de treinamento em dados das próprias empresas. No entanto, as soluções de nuvem pública, embora convenientes, muitas vezes apresentam limitações, incluindo riscos de segurança associados à soberania dos dados, bem como custos imprevisíveis e problemas de conformidade regulamentar.

Fonte da imagem: Dell

A implantação de modelos abertos de grandes linguagens (LLMs) como o Llama 2 no local oferece aos clientes custos previsíveis e controle total sobre seus dados, reduzindo o risco de segurança e o vazamento de propriedade intelectual e garantindo a conformidade regulatória, diz Dell. As soluções Dell Generative AI, juntamente com o Dell Validated Design for Generative AI, oferecem aos clientes software e hardware pré-testados e prontos para uso, desenvolvidos especificamente para IA generativa.

Fonte da imagem: Dell

Agora, a Dell, em colaboração com a Meta✴, expandiu seu portfólio de ofertas de IA generativa – os clientes agora podem implantar e ajustar facilmente os modelos de IA Meta✴ Llama 2 da Meta✴ em um ambiente local. A solução Dell Validated Design for Generative AI, juntamente com o Llama 2, fornece às empresas infraestrutura, software e serviços Dell prontos para uso para otimizar a implantação e o gerenciamento de projetos de IA locais. Llama 2 é testado e verificado pela Dell, incluindo trabalho com (SFT), LoRA e p-tuning em modelos com 7, 13 e 70 bilhões de parâmetros

Com orientação de implantação e configuração, as empresas podem colocar rapidamente sua infraestrutura de IA em funcionamento e usar o Llama 2 com maior previsibilidade. Em particular, estão disponíveis análises de uso de memória, latência e eficiência de LLM. “Nosso objetivo é nos tornarmos o fornecedor de infraestrutura local preferido dos clientes que implantam o Llama 2 e fornecer aos nossos clientes as melhores soluções de IA generativa da categoria”, afirmou a empresa. A base de hardware inclui os servidores PowerEdge XE9680, bem como o PowerEdge R760xa (com NVIDIA L40S).

avalanche

Postagens recentes

Elon Musk quer colocar os reguladores americanos contra seus homólogos europeus por discriminarem a SpaceX no mercado da UE.

A experiência política de Elon Musk pode ser interpretada de várias maneiras, mas, ainda no…

54 minutos atrás

Os primeiros protótipos da memória HBM4E da Samsung estarão prontos no próximo mês.

Para a Samsung Electronics, é crucial garantir sua posição no mercado de HBM4E, fornecendo aos…

3 horas atrás

A construção do gigantesco centro de dados de IA de Trump está paralisada: sem clientes, CEO demitido, ações em queda livre.

O maior projeto de construção de um campus de data center de IA do mundo,…

7 horas atrás

A Alphabet está em negociações com a Marvell para desenvolver dois chips de IA para inferência.

A Alphabet iniciou negociações com a Marvell para desenvolver chips especializados capazes de executar modelos…

10 horas atrás

A Blue Origin reutilizou, pela primeira vez, o primeiro estágio de seu gigantesco foguete New Glen.

A empresa aeroespacial de Jeff Bezos, a Blue Origin, deu um grande passo rumo à…

14 horas atrás

A Microsoft adiciona o Agente de IA à barra de tarefas do Windows 11.

A Microsoft confirmou que não tem planos de abandonar os agentes de IA no Windows…

16 horas atrás