A Nvidia anunciou detalhes de sua nova família de modelos Nemotron 3 de escala aberta, projetada, em parte, para viabilizar a próxima geração de IA especializada baseada em agentes.

Fonte da imagem: Nvidia

O primeiro membro da família é o Nemotron 3 Nano 30B, um modelo com pesos abertos, 30 bilhões de parâmetros totais e 3 bilhões de parâmetros ativos. O modelo é baseado na arquitetura híbrida Mamba-Transformer, que combina uma mistura de especialistas (MoE), aprendizado por reforço (RL) em ambientes interativos e uma janela de contexto personalizada de 1 milhão de tokens, permitindo raciocínio de alto desempenho e longo prazo para aplicações multiagentes.

De acordo com o VideoCardz, citando uma publicação da Hugging Face, o roteador ativa 6 dos 128 especialistas em uma única passagem. A Nvidia afirmou que o modelo pode ser executado no sistema DGX Spark, bem como nos aceleradores H100 e B200.

Entre os novos recursos do Nemotron 3 que atendem diretamente às necessidades de sistemas baseados em agentes estão:

A família Nemotron 3 MoE inclui três modelos:

O Nemotron 3 Nano, com manuais prontos para uso, já está disponível. Os modelos Nemotron 3 Super e Ultra serão lançados posteriormente.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *