Categorias: Mercado de tecnologia e TI. notícia

Mistral AI e NVIDIA revelam o modelo de IA empresarial Mistral NeMo 12B com “senso comum” e “conhecimento mundial”

A NVIDIA Corporation e a empresa francesa Mistral AI anunciaram o modelo de linguagem grande (LLM) Mistral NeMo 12B, especialmente projetado para resolver várias tarefas de nível empresarial – chatbots, resumo de dados, trabalho com código de programa, etc.

Mistral NeMo 12B possui 12 bilhões de parâmetros e usa uma janela de contexto de 128 mil tokens. A inferência usa o formato de dados FP8, que reduz os requisitos de memória e acelera a implantação sem qualquer redução na precisão da resposta.

Imagem Fonte: Pixabay.com

No treinamento do modelo foi utilizada a biblioteca Megatron-LM, que faz parte da plataforma NVIDIA NeMo. Neste caso, foram utilizados 3.072 aceleradores NVIDIA H100 baseados em DGX Cloud. Alega-se que o Mistral NeMo 12B lida bem com diálogos multipassados, problemas matemáticos, programação, etc. O modelo tem “senso comum” e “conhecimento de mundo”. No geral, ele relata desempenho preciso e confiável em uma ampla gama de aplicações.

O modelo é lançado sob a licença Apache 2.0 e é oferecido como um contêiner NIM. A implementação do LLM, segundo os idealizadores, leva questão de minutos, não de dias. Para rodar o modelo, basta um acelerador NVIDIA L40S, GeForce RTX 4090 ou RTX 4500. Entre as principais vantagens da implantação via NIM estão alta eficiência, baixo custo computacional, segurança e privacidade.

avalanche

Próximo Nvidia está preparando o acelerador de IA anti-sanções de última geração Blackwell para a China »

Anterior « Ações de Taiwan caem após Joe Biden desistir da corrida presidencial dos EUA

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

Consoles de jogos

O Ayaneo Pocket Micro 2, um console portátil compacto com um processador Snapdragon 865 personalizado, foi lançado por US$ 239.

A Ayaneo lançou o Pocket Micro 2, seu segundo console Android em miniatura e formato…

2 horas atrás

Os Raspberry Pi 4 Modelo B com clock reduzido já estão disponíveis para compra.

Uma nova versão do computador de placa única Raspberry Pi 4 Modelo B já está…

3 horas atrás

A Comissão Europeia tomou conhecimento da AWS e do Microsoft Azure.

A Comissão Europeia anunciou que chegou a uma conclusão preliminar para incluir os principais serviços…

3 horas atrás

Sistemas operacionais

Um entusiasta conseguiu executar o Windows 11 em um computador com memória DDR, um processador Intel Core 2 Quad e uma placa de vídeo Radeon HD 4650.

A escassez de chips de memória e os preços exorbitantes estão inspirando entusiastas a grandes…

3 horas atrás

Aplicativos Android

O Gemini agora consegue encontrar aplicativos na Play Store por meio de comandos de voz.

A Google Play Store provavelmente tem aplicativos para todos os gostos e necessidades, mas a…

3 horas atrás

Consoles de jogos

As vendas do PlayStation despencaram para o nível mais baixo desde 2000, enquanto o Xbox teve seu pior mês de maio de todos os tempos.

As vendas de consoles Xbox da Microsoft nos EUA em maio de 2026 foram as…

3 horas atrás

Mistral AI e NVIDIA revelam o modelo de IA empresarial Mistral NeMo 12B com “senso comum” e “conhecimento mundial”

Conteúdo relacionado

Postagens recentes

O Ayaneo Pocket Micro 2, um console portátil compacto com um processador Snapdragon 865 personalizado, foi lançado por US$ 239.

Os Raspberry Pi 4 Modelo B com clock reduzido já estão disponíveis para compra.

A Comissão Europeia tomou conhecimento da AWS e do Microsoft Azure.

Um entusiasta conseguiu executar o Windows 11 em um computador com memória DDR, um processador Intel Core 2 Quad e uma placa de vídeo Radeon HD 4650.

O Gemini agora consegue encontrar aplicativos na Play Store por meio de comandos de voz.

As vendas do PlayStation despencaram para o nível mais baixo desde 2000, enquanto o Xbox teve seu pior mês de maio de todos os tempos.