Microsoft revela modelo de raciocínio de IA Phi-4 Mini-Flash — 10 vezes mais rápido que seus análogos e pode até rodar em smartphones

A Microsoft lançou um novo modelo de IA de raciocínio mini-flash Phi-4 que oferece recursos avançados de raciocínio para ambientes de ponta, móveis e com limitações de computação. Utilizando uma nova arquitetura híbrida SambaY, o modelo é até 10 vezes mais rápido que outros modelos Phi da Microsoft e oferece latência de 2 a 3 vezes menor.

Fonte da imagem: Igor Omilaev/unsplash.com

Phi-4-mini-flash-reasoning é um modelo de código aberto com 3,8 bilhões de parâmetros, otimizado para raciocínio matemático complexo. Ele suporta comprimentos de contexto de até 64.000 tokens e é treinado em dados sintéticos de alta qualidade, permitindo implantações robustas e de alto desempenho com uso intensivo de lógica. Como todos os modelos da família Phi, o Phi-4-mini-flash-reasoning pode ser implantado em uma única GPU.

A principal característica da arquitetura SambaY é a Unidade de Memória Fechada (GMU) — um mecanismo simples, porém eficaz, para a troca de representações entre os componentes do modelo. O uso de GMUs aumenta significativamente a eficiência da decodificação e acelera as buscas em contextos longos, o que garante alto desempenho em uma ampla gama de tarefas e permite uma aceleração significativa da inferência sem perda da qualidade do raciocínio.

A Microsoft diz que o novo modelo de IA pode ser usado em plataformas de aprendizagem adaptáveis, onde ciclos de feedback em tempo real são essenciais, como agentes com capacidades de raciocínio em dispositivos de ponta e em sistemas educacionais interativos que ajustam dinamicamente a dificuldade do conteúdo com base no desempenho do aluno.

A empresa enfatiza que o alto desempenho do modelo em matemática e pensamento estruturado o torna especialmente valioso para tecnologias educacionais, simulações simples e ferramentas de avaliação automatizadas que exigem inferência confiável com tempo de resposta mínimo.

O modelo de raciocínio mini-flash Phi-4 da Microsoft está disponível na plataforma Hugging Face.

admin

Postagens recentes

O Google vinculou o reCAPTCHA aos Serviços do Google Play, interrompendo a verificação para usuários do Android que não possuem os serviços do Google.

O Google integrou o sistema de verificação reCAPTCHA de última geração à plataforma fechada Google…

6 horas atrás

A Samsung expande sua equipe de robótica humanoide e acelera a transformação da IA.

A Samsung Electronics expandiu sua equipe de robótica do futuro e, simultaneamente, sua divisão de…

6 horas atrás

A Nvidia gastou mais de 40 bilhões de dólares na aquisição de ativos de outras empresas este ano.

Com receitas recordes em meio ao boom da IA, a Nvidia tem investido muito mais…

10 horas atrás

Foram revelados detalhes sobre os próximos processadores da Intel: Nova Lake, Razor Lake, Titan Lake e Moon Lake, que serão lançados antes de 2028.

A Intel planeja apresentar seus processadores Nova Lake no segundo semestre deste ano. Embora muito…

10 horas atrás

Sob a liderança de Lip-Bu Tan, a Intel nunca conseguiu se livrar de seus problemas centrais.

O impressionante desempenho das ações da Intel este ano pode dar a impressão de que…

17 horas atrás