Microsoft revela modelo de raciocínio de IA Phi-4 Mini-Flash — 10 vezes mais rápido que seus análogos e pode até rodar em smartphones

A Microsoft lançou um novo modelo de IA de raciocínio mini-flash Phi-4 que oferece recursos avançados de raciocínio para ambientes de ponta, móveis e com limitações de computação. Utilizando uma nova arquitetura híbrida SambaY, o modelo é até 10 vezes mais rápido que outros modelos Phi da Microsoft e oferece latência de 2 a 3 vezes menor.

Fonte da imagem: Igor Omilaev/unsplash.com

Phi-4-mini-flash-reasoning é um modelo de código aberto com 3,8 bilhões de parâmetros, otimizado para raciocínio matemático complexo. Ele suporta comprimentos de contexto de até 64.000 tokens e é treinado em dados sintéticos de alta qualidade, permitindo implantações robustas e de alto desempenho com uso intensivo de lógica. Como todos os modelos da família Phi, o Phi-4-mini-flash-reasoning pode ser implantado em uma única GPU.

A principal característica da arquitetura SambaY é a Unidade de Memória Fechada (GMU) — um mecanismo simples, porém eficaz, para a troca de representações entre os componentes do modelo. O uso de GMUs aumenta significativamente a eficiência da decodificação e acelera as buscas em contextos longos, o que garante alto desempenho em uma ampla gama de tarefas e permite uma aceleração significativa da inferência sem perda da qualidade do raciocínio.

A Microsoft diz que o novo modelo de IA pode ser usado em plataformas de aprendizagem adaptáveis, onde ciclos de feedback em tempo real são essenciais, como agentes com capacidades de raciocínio em dispositivos de ponta e em sistemas educacionais interativos que ajustam dinamicamente a dificuldade do conteúdo com base no desempenho do aluno.

A empresa enfatiza que o alto desempenho do modelo em matemática e pensamento estruturado o torna especialmente valioso para tecnologias educacionais, simulações simples e ferramentas de avaliação automatizadas que exigem inferência confiável com tempo de resposta mínimo.

O modelo de raciocínio mini-flash Phi-4 da Microsoft está disponível na plataforma Hugging Face.

admin

Postagens recentes

O RPG de ação inspirado em Mass Effect, The Expanse: Osiris Reborn, está prestes a sair das sombras, com um novo Xbox Partner Preview anunciado.

A Microsoft Gaming confirmou planos para realizar outra apresentação Xbox Partner Preview em um futuro…

18 minutos atrás

O iPhone Air acabou sendo muito mais popular que o iPhone 16 Plus, e o modem Apple C1X quase alcançou os análogos da Qualcomm

\nO Apple iPhone Air no período de lançamento comparável revelou-se aproximadamente duas vezes mais popular…

1 hora atrás

Após uma onda de críticas, a desenvolvedora de Crimson Desert prometeu adicionar suporte para placas gráficas Intel Arc.

A Pearl Abyss mudou sua posição em relação ao suporte para placas de vídeo Intel…

2 horas atrás

A ASRock Industrial lança a estação de trabalho compacta AI Box-A395 baseada no AMD Ryzen AI Max.

A ASRock Industrial anunciou a workstation compacta AI Box-A395, projetada para trabalhar com grandes modelos…

2 horas atrás

O mini PC ASUS ExpertCenter PN55 possui um chip AMD Ryzen AI 400 com desempenho de IA de até 91 TOPS.

A ASUS anunciou o ExpertCenter PN55, um desktop de formato compacto projetado para uso empresarial.…

2 horas atrás

A Intel admitiu que seus novos processadores Core Ultra Plus para desktops não são praticamente mais rápidos que os Ryzen em jogos.

A Intel comparou o desempenho em jogos dos processadores Core Ultra 5 250K Plus e…

3 horas atrás