Microsoft revela três novos modelos de IA de pequeno porte na família Phi-4

A Microsoft lançou três novos modelos de linguagem pequena (SLMs) sob uma licença aberta: Phi-4-mini-reasoning, Phi-4-reasoning e Phi-4-reasoning-plus. Cada um dos modelos pertence à classe de modelos de raciocínio, focados na verificação lógica de decisões e na elaboração cuidadosa de problemas complexos. Esses modelos de IA são uma continuação da iniciativa da Microsoft de desenvolver sistemas compactos de IA, a família Phi, introduzida pela primeira vez há um ano como base para aplicativos executados em dispositivos com capacidades de computação limitadas.

Fonte da imagem: Jackson Sophat / Unsplash

O mais produtivo dos modelos de IA apresentados é o Phi-4-reasoning-plus. É uma adaptação do Phi-4 lançado anteriormente para tarefas de inferência lógica. De acordo com a Microsoft, sua qualidade de resposta é próxima à do DeepSeek R1, apesar de uma diferença significativa no volume de parâmetros: o DeepSeek R1 tem 671 bilhões, enquanto o Phi-4-reasoning-plus tem significativamente menos. De acordo com os testes internos da Microsoft, o modelo teve um desempenho de acordo com o modelo de IA o3-mini da OpenAI no benchmark OmniMath, que avalia as habilidades matemáticas da IA.

Os modelos Phi-4-reasoning e Phi-4-reasoning-plus (14 bilhões de parâmetros) demonstram superioridade sobre o Phi-4 de base e competem com confiança com sistemas maiores, incluindo DeepSeek-R1 Distill (70 bilhões de parâmetros) e OpenAI o3-mini, em tarefas de raciocínio matemático e lógico (AIME, HMMT, OmniMath, GPQA). Fonte da imagem: Microsoft

O modelo de raciocínio Phi-4 contém 14 bilhões de parâmetros e foi treinado com dados de “qualidade” da internet, bem como exemplos de demonstração selecionados do o3-mini. Ele é otimizado para tarefas em matemática, ciências e programação. Assim, o raciocínio Phi-4 é focado na computação de alta precisão e na interpretação analítica de dados, ao mesmo tempo em que permanece relativamente compacto e acessível para uso em plataformas de computação locais.

Em benchmarks de uso geral, incluindo FlenQA, IFEval, HumanEvalPlus, MMLUPro, ToxiGen e PhiBench, os modelos Phi-4-reasoning-plus demonstram precisão comparável ao GPT-4o e o3-mini, apesar de terem um tamanho de parâmetro menor (14 bilhões de parâmetros), especialmente em tarefas de programação, lógica e segurança. Fonte da imagem: Microsoft

Phi-4-mini-raciocínio é o menor dos SLMs apresentados. Seu tamanho é de cerca de 3,8 bilhões de parâmetros. Ele foi treinado em aproximadamente 1 milhão de problemas matemáticos sintéticos gerados pelo modelo de IA R1 da startup chinesa DeepSeek. A Microsoft o posiciona como um modelo de IA para cenários educacionais, incluindo “aprendizagem incorporada” em dispositivos móveis e de baixo consumo de energia. Devido à sua compactação e precisão, este modelo de IA pode ser usado em sistemas de aprendizagem interativos onde a velocidade de resposta e os recursos de computação limitados são uma prioridade.

O Phi-4-mini-reasoning (3,8 bilhões de parâmetros) supera significativamente sua linha de base e modelos com o dobro do tamanho nos benchmarks AIME 24, MATH-500 e GPQA Diamond, e é comparável ou melhor que o OpenAI o1-mini em precisão de geração de respostas matemáticas longas. Fonte da imagem: Microsoft

Todos os três modelos de IA estão disponíveis na plataforma Hugging Face e são distribuídos sob uma licença aberta. De acordo com a Microsoft, eles foram treinados usando destilação, aprendizado de reforço e dados de treinamento de alta qualidade. Esses métodos permitiram equilibrar o tamanho dos SLMs e seu desempenho computacional. Os modelos de IA são compactos o suficiente para serem usados ​​em ambientes de baixa latência, mas ainda são capazes de resolver problemas que exigem construção lógica rigorosa e resultados confiáveis. Anteriormente, tais tarefas eram típicas apenas para IAs muito maiores.

avalanche

Postagens recentes

“Ainda me recuperando da ressaca”: Desenvolvedores de Ghost of Yotei comemoram o atraso de GTA VI em grande estilo

O adiamento do jogo de ação policial GTA VI da Rockstar Games, deste outono para…

27 minutos atrás

“É para entusiastas dispostos a gastar”: Lenovo tenta justificar o alto preço do Legion Go 2

A Lenovo revelou o console portátil Legion Go de segunda geração, com preço inicial de…

2 horas atrás