A Microsoft lançou um novo modelo de IA de raciocínio mini-flash Phi-4 que oferece recursos avançados de raciocínio para ambientes de ponta, móveis e com limitações de computação. Utilizando uma nova arquitetura híbrida SambaY, o modelo é até 10 vezes mais rápido que outros modelos Phi da Microsoft e oferece latência de 2 a 3 vezes menor.

Fonte da imagem: Igor Omilaev/unsplash.com

Phi-4-mini-flash-reasoning é um modelo de código aberto com 3,8 bilhões de parâmetros, otimizado para raciocínio matemático complexo. Ele suporta comprimentos de contexto de até 64.000 tokens e é treinado em dados sintéticos de alta qualidade, permitindo implantações robustas e de alto desempenho com uso intensivo de lógica. Como todos os modelos da família Phi, o Phi-4-mini-flash-reasoning pode ser implantado em uma única GPU.

A principal característica da arquitetura SambaY é a Unidade de Memória Fechada (GMU) — um mecanismo simples, porém eficaz, para a troca de representações entre os componentes do modelo. O uso de GMUs aumenta significativamente a eficiência da decodificação e acelera as buscas em contextos longos, o que garante alto desempenho em uma ampla gama de tarefas e permite uma aceleração significativa da inferência sem perda da qualidade do raciocínio.

A Microsoft diz que o novo modelo de IA pode ser usado em plataformas de aprendizagem adaptáveis, onde ciclos de feedback em tempo real são essenciais, como agentes com capacidades de raciocínio em dispositivos de ponta e em sistemas educacionais interativos que ajustam dinamicamente a dificuldade do conteúdo com base no desempenho do aluno.

A empresa enfatiza que o alto desempenho do modelo em matemática e pensamento estruturado o torna especialmente valioso para tecnologias educacionais, simulações simples e ferramentas de avaliação automatizadas que exigem inferência confiável com tempo de resposta mínimo.

O modelo de raciocínio mini-flash Phi-4 da Microsoft está disponível na plataforma Hugging Face.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *