Mistral AI e NVIDIA revelam o modelo de IA empresarial Mistral NeMo 12B com “senso comum” e “conhecimento mundial”

A NVIDIA Corporation e a empresa francesa Mistral AI anunciaram o modelo de linguagem grande (LLM) Mistral NeMo 12B, especialmente projetado para resolver várias tarefas de nível empresarial – chatbots, resumo de dados, trabalho com código de programa, etc.

Mistral NeMo 12B possui 12 bilhões de parâmetros e usa uma janela de contexto de 128 mil tokens. A inferência usa o formato de dados FP8, que reduz os requisitos de memória e acelera a implantação sem qualquer redução na precisão da resposta.

Imagem Fonte: Pixabay.com

No treinamento do modelo foi utilizada a biblioteca Megatron-LM, que faz parte da plataforma NVIDIA NeMo. Neste caso, foram utilizados 3.072 aceleradores NVIDIA H100 baseados em DGX Cloud. Alega-se que o Mistral NeMo 12B lida bem com diálogos multipassados, problemas matemáticos, programação, etc. O modelo tem “senso comum” e “conhecimento de mundo”. No geral, ele relata desempenho preciso e confiável em uma ampla gama de aplicações.

O modelo é lançado sob a licença Apache 2.0 e é oferecido como um contêiner NIM. A implementação do LLM, segundo os idealizadores, leva questão de minutos, não de dias. Para rodar o modelo, basta um acelerador NVIDIA L40S, GeForce RTX 4090 ou RTX 4500. Entre as principais vantagens da implantação via NIM estão alta eficiência, baixo custo computacional, segurança e privacidade.

avalanche

Postagens recentes

A Cooler Master apresenta o cooler para CPU V8 Ace 3DHP com desempenho térmico “extremo”.

Na Computex 2026, a Cooler Master apresentou o cooler de ar de torre única V8…

58 minutos atrás

A AMD conquistou um terço do mercado de processadores x86 da Intel, enquanto o mercado de CPUs para desktops sofreu uma queda de 20%.

A Mercury Research divulgou um resumo dos resultados do mercado de processadores para o primeiro…

58 minutos atrás

A FromSoftware confirmou a data de lançamento de Elden Ring: Tarnished Edition para Nintendo Switch 2 e a expansão paga para outras plataformas.

A Bandai Namco, editora do jogo, e a FromSoftware, desenvolvedora japonesa, anunciaram a data de…

2 horas atrás

A PowerColor apresentou placas gráficas Radeon RX 9000 que brilham sob luz ultravioleta.

A PowerColor apresentou diversas placas gráficas personalizadas da série Radeon RX 9000 na Computex 2026.…

2 horas atrás

A Swissbit apresenta a série de SSDs N7000 com armazenamento M.2 de 3,84 TB.

A Swissbit anunciou a série N7000 de SSDs, projetada para uso em equipamentos industriais e…

2 horas atrás