A empresa francesa Mistral IA, fundada por imigrantes do Google Deepmind e Meta✴, introduziu o modelo compacto de inteligência artificial Small 3 – se espalha com código aberto e oferece alto desempenho.
Fonte da imagem: Michael Dziedzic / Unsplash.com
O Mistral Small 3 possui 24 bilhões de parâmetros e está posicionado como um concorrente direto para modelos maiores, incluindo Meta✴ Llama 3.3 70B e Alibaba Qwen 32B, bem como a substituição livre de sistemas fechados, incluindo o OpenAI GPT-4O Mini. O desenvolvedor garante que o novo modelo forneça os resultados no mesmo nível com o instrutor LLAMA 3.3 70B, mas funciona três vezes mais rápido no mesmo equipamento e foi projetado para 80 % das tarefas da IA generativa.
A seguir, a fonte da imagem: Mistral.ai
O sistema foi criado de olho na implantação local – sua arquitetura possui camadas significativamente menores em comparação com os modelos concorrentes, o que reduz o tempo para a passagem direta. A precisão do pequeno Mistral 3 no teste MMLU é de 81 %, com um atraso em 150 tokens por segundo, o que, segundo o desenvolvedor, o torna o mais eficaz em sua categoria. Também pode servir como base para criar modelos de raciocínio mais complexos, como o Deepseek R1.
A nova rede neural foi testada cegamente entre os contratados de terceiros – o procedimento incluiu mais de mil tarefas para escrever código e respostas para perguntas gerais. O Mistral Small 3 emitiu resultados competitivos em comparação com modelos abertos de três vezes mais, bem como um Mini GPT-4O fechado em ensaios relacionados ao código de escrita, resolvendo problemas matemáticos, testando conhecimentos gerais e realizando instruções.
Na prática, o modelo será útil nos casos em que respostas rápidas e precisas são extremamente importantes-esses podem ser assistentes virtuais, AI-agentes e automação de processos de trabalho em tempo real. O desenvolvedor proporcionou aos usuários a capacidade de realizar uma boa configuração do Mistral Small 3 por sua especialização em determinadas áreas – podem ser aconselhamento jurídico, diagnóstico médico e suporte técnico.
No campo dos serviços médicos, Mistral Small 3 é capaz de identificar tentativas de fraude; na medicina – direcionar pacientes para os especialistas certos; Na robótica, a indústria automobilística e a produção – realizam funções de controle e controle; São fornecidos cenários de atendimento ao cliente virtual, análise de humor e revisões. Ele pode ser lançado em um sistema com uma placa de vídeo Nvidia GeForce RTX 4090 ou no Apple MacBook real com 32 GB de RAM.
O Mistral Small 3 já está disponível e aparecerá em todas as maiores plataformas especializadas em um futuro próximo – se espalha pela licença gratuita e aberta do Apache 2.0.