A empresa francesa Mistral IA, fundada por imigrantes do Google Deepmind e Meta✴, introduziu o modelo compacto de inteligência artificial Small 3 – se espalha com código aberto e oferece alto desempenho.
Fonte da imagem: Michael Dziedzic / Unsplash.com
O Mistral Small 3 possui 24 bilhões de parâmetros e está posicionado como um concorrente direto para modelos maiores, incluindo Meta✴ Llama 3.3 70B e Alibaba Qwen 32B, bem como a substituição livre de sistemas fechados, incluindo o OpenAI GPT-4O Mini. O desenvolvedor garante que o novo modelo forneça os resultados no mesmo nível com o instrutor LLAMA 3.3 70B, mas funciona três vezes mais rápido no mesmo equipamento e foi projetado para 80 % das tarefas da IA generativa.
A seguir, a fonte da imagem: Mistral.ai
O sistema foi criado de olho na implantação local – sua arquitetura possui camadas significativamente menores em comparação com os modelos concorrentes, o que reduz o tempo para a passagem direta. A precisão do pequeno Mistral 3 no teste MMLU é de 81 %, com um atraso em 150 tokens por segundo, o que, segundo o desenvolvedor, o torna o mais eficaz em sua categoria. Também pode servir como base para criar modelos de raciocínio mais complexos, como o Deepseek R1.
A nova rede neural foi testada cegamente entre os contratados de terceiros – o procedimento incluiu mais de mil tarefas para escrever código e respostas para perguntas gerais. O Mistral Small 3 emitiu resultados competitivos em comparação com modelos abertos de três vezes mais, bem como um Mini GPT-4O fechado em ensaios relacionados ao código de escrita, resolvendo problemas matemáticos, testando conhecimentos gerais e realizando instruções.
Na prática, o modelo será útil nos casos em que respostas rápidas e precisas são extremamente importantes-esses podem ser assistentes virtuais, AI-agentes e automação de processos de trabalho em tempo real. O desenvolvedor proporcionou aos usuários a capacidade de realizar uma boa configuração do Mistral Small 3 por sua especialização em determinadas áreas – podem ser aconselhamento jurídico, diagnóstico médico e suporte técnico.
No campo dos serviços médicos, Mistral Small 3 é capaz de identificar tentativas de fraude; na medicina – direcionar pacientes para os especialistas certos; Na robótica, a indústria automobilística e a produção – realizam funções de controle e controle; São fornecidos cenários de atendimento ao cliente virtual, análise de humor e revisões. Ele pode ser lançado em um sistema com uma placa de vídeo Nvidia GeForce RTX 4090 ou no Apple MacBook real com 32 GB de RAM.
O Mistral Small 3 já está disponível e aparecerá em todas as maiores plataformas especializadas em um futuro próximo – se espalha pela licença gratuita e aberta do Apache 2.0.
Uma entusiasta que se identificou como Hailey lançou um projeto original, que ela chamou de…
Autoridades do Oriente Médio alegaram que os EUA usaram backdoors ou botnets para desativar alguns…
O boom da IA, caracterizado pela alta demanda por memória e aumentos acentuados de preços,…
A Gigabyte apresentou o Gaming A18 Pro, um notebook gamer com design fino, tela grande…
O Google anunciou planos para transformar o Chrome em um "navegador automatizado" para usuários corporativos,…
A TSMC sempre se concentrou no desenvolvimento, implementação e aprimoramento de processos avançados de fabricação…