Microsoft revela modelo de raciocínio de IA Phi-4 Mini-Flash — 10 vezes mais rápido que seus análogos e pode até rodar em smartphones

A Microsoft lançou um novo modelo de IA de raciocínio mini-flash Phi-4 que oferece recursos avançados de raciocínio para ambientes de ponta, móveis e com limitações de computação. Utilizando uma nova arquitetura híbrida SambaY, o modelo é até 10 vezes mais rápido que outros modelos Phi da Microsoft e oferece latência de 2 a 3 vezes menor.

Fonte da imagem: Igor Omilaev/unsplash.com

Phi-4-mini-flash-reasoning é um modelo de código aberto com 3,8 bilhões de parâmetros, otimizado para raciocínio matemático complexo. Ele suporta comprimentos de contexto de até 64.000 tokens e é treinado em dados sintéticos de alta qualidade, permitindo implantações robustas e de alto desempenho com uso intensivo de lógica. Como todos os modelos da família Phi, o Phi-4-mini-flash-reasoning pode ser implantado em uma única GPU.

A principal característica da arquitetura SambaY é a Unidade de Memória Fechada (GMU) — um mecanismo simples, porém eficaz, para a troca de representações entre os componentes do modelo. O uso de GMUs aumenta significativamente a eficiência da decodificação e acelera as buscas em contextos longos, o que garante alto desempenho em uma ampla gama de tarefas e permite uma aceleração significativa da inferência sem perda da qualidade do raciocínio.

A Microsoft diz que o novo modelo de IA pode ser usado em plataformas de aprendizagem adaptáveis, onde ciclos de feedback em tempo real são essenciais, como agentes com capacidades de raciocínio em dispositivos de ponta e em sistemas educacionais interativos que ajustam dinamicamente a dificuldade do conteúdo com base no desempenho do aluno.

A empresa enfatiza que o alto desempenho do modelo em matemática e pensamento estruturado o torna especialmente valioso para tecnologias educacionais, simulações simples e ferramentas de avaliação automatizadas que exigem inferência confiável com tempo de resposta mínimo.

O modelo de raciocínio mini-flash Phi-4 da Microsoft está disponível na plataforma Hugging Face.

admin

Postagens recentes

A Apple se recusou a implementar Claude na Siri devido à insaciabilidade da Anthropic.

A Apple abandonou o modelo de IA Claude da Anthropic para aprimorar a Siri e,…

25 minutos atrás

A Intel apresentou um protótipo de um enorme chip de IA com quatro unidades lógicas e 12 módulos HBM4.

A Intel Foundry divulgou um relatório técnico detalhando as soluções avançadas de design e implementação…

8 horas atrás

A Samsung, a SK Hynix e a Micron estão reavaliando todos os pedidos de memória para evitar compras em grande quantidade.

Segundo o Nikkei Asia, três grandes fabricantes de chips de memória — Micron, SK Hynix…

8 horas atrás

O console portátil MSI Claw A8 com Ryzen Z2 Extreme chegou aos EUA e à Europa, com preço de US$ 1.149 para a versão com 24 GB de RAM.

O MSI Claw A8 é o primeiro console portátil da empresa baseado na plataforma AMD.…

11 horas atrás

A SK Hynix supera a Samsung em lucro anual pela primeira vez em meio ao boom da IA.

Historicamente, a Samsung Electronics tem sido consistentemente a maior fornecedora mundial de componentes semicondutores em…

12 horas atrás