Mistral AI e NVIDIA revelam o modelo de IA empresarial Mistral NeMo 12B com “senso comum” e “conhecimento mundial”

A NVIDIA Corporation e a empresa francesa Mistral AI anunciaram o modelo de linguagem grande (LLM) Mistral NeMo 12B, especialmente projetado para resolver várias tarefas de nível empresarial – chatbots, resumo de dados, trabalho com código de programa, etc.

Mistral NeMo 12B possui 12 bilhões de parâmetros e usa uma janela de contexto de 128 mil tokens. A inferência usa o formato de dados FP8, que reduz os requisitos de memória e acelera a implantação sem qualquer redução na precisão da resposta.

Imagem Fonte: Pixabay.com

No treinamento do modelo foi utilizada a biblioteca Megatron-LM, que faz parte da plataforma NVIDIA NeMo. Neste caso, foram utilizados 3.072 aceleradores NVIDIA H100 baseados em DGX Cloud. Alega-se que o Mistral NeMo 12B lida bem com diálogos multipassados, problemas matemáticos, programação, etc. O modelo tem “senso comum” e “conhecimento de mundo”. No geral, ele relata desempenho preciso e confiável em uma ampla gama de aplicações.

O modelo é lançado sob a licença Apache 2.0 e é oferecido como um contêiner NIM. A implementação do LLM, segundo os idealizadores, leva questão de minutos, não de dias. Para rodar o modelo, basta um acelerador NVIDIA L40S, GeForce RTX 4090 ou RTX 4500. Entre as principais vantagens da implantação via NIM estão alta eficiência, baixo custo computacional, segurança e privacidade.

avalanche

Postagens recentes

Orken é um RPG de ação e fantasia sobre a luta entre orcs e humanos, uma mistura de Dark Souls, Mass Effect e Hi-Fi Rush.

O estúdio de arte alemão Sixmorevodka, conhecido por suas ilustrações para League of Legends, decidiu…

46 minutos atrás

A Gunnir e a Sparkle lançaram as placas gráficas profissionais Intel Arc Pro B60, com preços a partir de US$ 745.

A Gunnir e a Sparkle lançaram suas versões da placa gráfica Intel Arc Pro B60…

1 hora atrás

O Snapdragon X2 Plus mostrou-se mais rápido que os processadores Intel e AMD, mas perdeu para o Apple M4 nos primeiros testes.

A PC Magazine testou os processadores Snapdragon X2 Plus, apresentados pela Qualcomm na CES 2026,…

3 horas atrás

O mercado de semicondutores cresceu 21%, atingindo US$ 793 bilhões no ano passado, com a Intel saindo do grupo das três maiores empresas.

Especialistas da Gartner já resumiram os resultados do mercado de semicondutores do ano passado, relatando…

3 horas atrás

O CEO da Nvidia não acredita em “IA divina” e critica previsões pessimistas.

A Nvidia continua sendo uma das principais beneficiárias do boom da IA, e por isso…

3 horas atrás

A Thermalright apresentou o Frost Tower 140, um grande cooler de torre dupla com ventoinhas de tamanhos variados.

A Thermalright lançou o Frost Tower 140, um cooler para CPU de torre dupla. O…

3 horas atrás