A empresa francesa Mistral IA, fundada por imigrantes do Google Deepmind e Meta✴, introduziu o modelo compacto de inteligência artificial Small 3 – se espalha com código aberto e oferece alto desempenho.
Fonte da imagem: Michael Dziedzic / Unsplash.com
O Mistral Small 3 possui 24 bilhões de parâmetros e está posicionado como um concorrente direto para modelos maiores, incluindo Meta✴ Llama 3.3 70B e Alibaba Qwen 32B, bem como a substituição livre de sistemas fechados, incluindo o OpenAI GPT-4O Mini. O desenvolvedor garante que o novo modelo forneça os resultados no mesmo nível com o instrutor LLAMA 3.3 70B, mas funciona três vezes mais rápido no mesmo equipamento e foi projetado para 80 % das tarefas da IA generativa.
A seguir, a fonte da imagem: Mistral.ai
O sistema foi criado de olho na implantação local – sua arquitetura possui camadas significativamente menores em comparação com os modelos concorrentes, o que reduz o tempo para a passagem direta. A precisão do pequeno Mistral 3 no teste MMLU é de 81 %, com um atraso em 150 tokens por segundo, o que, segundo o desenvolvedor, o torna o mais eficaz em sua categoria. Também pode servir como base para criar modelos de raciocínio mais complexos, como o Deepseek R1.
A nova rede neural foi testada cegamente entre os contratados de terceiros – o procedimento incluiu mais de mil tarefas para escrever código e respostas para perguntas gerais. O Mistral Small 3 emitiu resultados competitivos em comparação com modelos abertos de três vezes mais, bem como um Mini GPT-4O fechado em ensaios relacionados ao código de escrita, resolvendo problemas matemáticos, testando conhecimentos gerais e realizando instruções.
Na prática, o modelo será útil nos casos em que respostas rápidas e precisas são extremamente importantes-esses podem ser assistentes virtuais, AI-agentes e automação de processos de trabalho em tempo real. O desenvolvedor proporcionou aos usuários a capacidade de realizar uma boa configuração do Mistral Small 3 por sua especialização em determinadas áreas – podem ser aconselhamento jurídico, diagnóstico médico e suporte técnico.
No campo dos serviços médicos, Mistral Small 3 é capaz de identificar tentativas de fraude; na medicina – direcionar pacientes para os especialistas certos; Na robótica, a indústria automobilística e a produção – realizam funções de controle e controle; São fornecidos cenários de atendimento ao cliente virtual, análise de humor e revisões. Ele pode ser lançado em um sistema com uma placa de vídeo Nvidia GeForce RTX 4090 ou no Apple MacBook real com 32 GB de RAM.
O Mistral Small 3 já está disponível e aparecerá em todas as maiores plataformas especializadas em um futuro próximo – se espalha pela licença gratuita e aberta do Apache 2.0.
A Scality, especialista em armazenamento definido por software (SDS), revelou detalhes de uma nova classe…
A Stardust Solutions, empresa especializada em tecnologias de geoengenharia, propôs uma solução que, segundo ela,…
A Figure AI relatou que, durante os testes, seus robôs humanoides operaram por mais de…
A Comissão Federal de Comércio dos EUA (FTC, na sigla em inglês) iniciou uma investigação…
Um overclocker chinês apelidado de "Wytiwx" estabeleceu um novo recorde mundial de overclock de CPU,…
Em uma versão de teste do Windows lançada recentemente, os desenvolvedores implementaram diversos recursos muito…