A Microsoft lançou um novo modelo de IA de raciocínio mini-flash Phi-4 que oferece recursos avançados de raciocínio para ambientes de ponta, móveis e com limitações de computação. Utilizando uma nova arquitetura híbrida SambaY, o modelo é até 10 vezes mais rápido que outros modelos Phi da Microsoft e oferece latência de 2 a 3 vezes menor.
Fonte da imagem: Igor Omilaev/unsplash.com
Phi-4-mini-flash-reasoning é um modelo de código aberto com 3,8 bilhões de parâmetros, otimizado para raciocínio matemático complexo. Ele suporta comprimentos de contexto de até 64.000 tokens e é treinado em dados sintéticos de alta qualidade, permitindo implantações robustas e de alto desempenho com uso intensivo de lógica. Como todos os modelos da família Phi, o Phi-4-mini-flash-reasoning pode ser implantado em uma única GPU.
A principal característica da arquitetura SambaY é a Unidade de Memória Fechada (GMU) — um mecanismo simples, porém eficaz, para a troca de representações entre os componentes do modelo. O uso de GMUs aumenta significativamente a eficiência da decodificação e acelera as buscas em contextos longos, o que garante alto desempenho em uma ampla gama de tarefas e permite uma aceleração significativa da inferência sem perda da qualidade do raciocínio.
A Microsoft diz que o novo modelo de IA pode ser usado em plataformas de aprendizagem adaptáveis, onde ciclos de feedback em tempo real são essenciais, como agentes com capacidades de raciocínio em dispositivos de ponta e em sistemas educacionais interativos que ajustam dinamicamente a dificuldade do conteúdo com base no desempenho do aluno.
A empresa enfatiza que o alto desempenho do modelo em matemática e pensamento estruturado o torna especialmente valioso para tecnologias educacionais, simulações simples e ferramentas de avaliação automatizadas que exigem inferência confiável com tempo de resposta mínimo.
O modelo de raciocínio mini-flash Phi-4 da Microsoft está disponível na plataforma Hugging Face.
Enquanto alguns fãs estão recriando The Elder Scrolls III: Morrowind no motor Skyrim, outros estão…
O estúdio japonês Kojima Productions, fundado no final de 2015 pelo renomado designer de jogos…
A Apple deve lançar o primeiro iPhone com tela flexível, possivelmente chamado de iPhone Fold,…
Análise do modo ranqueado de Warface: fácil de pegar o jeito, difícil de largar
Embora o suporte de conteúdo para o RPG de ação cyberpunk em primeira pessoa Cyberpunk…
Parece difícil imaginar algo mais elementar do ponto de vista do usuário do que escolher…