Microsoft revela três novos modelos de IA de pequeno porte na família Phi-4

A Microsoft lançou três novos modelos de linguagem pequena (SLMs) sob uma licença aberta: Phi-4-mini-reasoning, Phi-4-reasoning e Phi-4-reasoning-plus. Cada um dos modelos pertence à classe de modelos de raciocínio, focados na verificação lógica de decisões e na elaboração cuidadosa de problemas complexos. Esses modelos de IA são uma continuação da iniciativa da Microsoft de desenvolver sistemas compactos de IA, a família Phi, introduzida pela primeira vez há um ano como base para aplicativos executados em dispositivos com capacidades de computação limitadas.

Fonte da imagem: Jackson Sophat / Unsplash

O mais produtivo dos modelos de IA apresentados é o Phi-4-reasoning-plus. É uma adaptação do Phi-4 lançado anteriormente para tarefas de inferência lógica. De acordo com a Microsoft, sua qualidade de resposta é próxima à do DeepSeek R1, apesar de uma diferença significativa no volume de parâmetros: o DeepSeek R1 tem 671 bilhões, enquanto o Phi-4-reasoning-plus tem significativamente menos. De acordo com os testes internos da Microsoft, o modelo teve um desempenho de acordo com o modelo de IA o3-mini da OpenAI no benchmark OmniMath, que avalia as habilidades matemáticas da IA.

Os modelos Phi-4-reasoning e Phi-4-reasoning-plus (14 bilhões de parâmetros) demonstram superioridade sobre o Phi-4 de base e competem com confiança com sistemas maiores, incluindo DeepSeek-R1 Distill (70 bilhões de parâmetros) e OpenAI o3-mini, em tarefas de raciocínio matemático e lógico (AIME, HMMT, OmniMath, GPQA). Fonte da imagem: Microsoft

O modelo de raciocínio Phi-4 contém 14 bilhões de parâmetros e foi treinado com dados de “qualidade” da internet, bem como exemplos de demonstração selecionados do o3-mini. Ele é otimizado para tarefas em matemática, ciências e programação. Assim, o raciocínio Phi-4 é focado na computação de alta precisão e na interpretação analítica de dados, ao mesmo tempo em que permanece relativamente compacto e acessível para uso em plataformas de computação locais.

Em benchmarks de uso geral, incluindo FlenQA, IFEval, HumanEvalPlus, MMLUPro, ToxiGen e PhiBench, os modelos Phi-4-reasoning-plus demonstram precisão comparável ao GPT-4o e o3-mini, apesar de terem um tamanho de parâmetro menor (14 bilhões de parâmetros), especialmente em tarefas de programação, lógica e segurança. Fonte da imagem: Microsoft

Phi-4-mini-raciocínio é o menor dos SLMs apresentados. Seu tamanho é de cerca de 3,8 bilhões de parâmetros. Ele foi treinado em aproximadamente 1 milhão de problemas matemáticos sintéticos gerados pelo modelo de IA R1 da startup chinesa DeepSeek. A Microsoft o posiciona como um modelo de IA para cenários educacionais, incluindo “aprendizagem incorporada” em dispositivos móveis e de baixo consumo de energia. Devido à sua compactação e precisão, este modelo de IA pode ser usado em sistemas de aprendizagem interativos onde a velocidade de resposta e os recursos de computação limitados são uma prioridade.

O Phi-4-mini-reasoning (3,8 bilhões de parâmetros) supera significativamente sua linha de base e modelos com o dobro do tamanho nos benchmarks AIME 24, MATH-500 e GPQA Diamond, e é comparável ou melhor que o OpenAI o1-mini em precisão de geração de respostas matemáticas longas. Fonte da imagem: Microsoft

Todos os três modelos de IA estão disponíveis na plataforma Hugging Face e são distribuídos sob uma licença aberta. De acordo com a Microsoft, eles foram treinados usando destilação, aprendizado de reforço e dados de treinamento de alta qualidade. Esses métodos permitiram equilibrar o tamanho dos SLMs e seu desempenho computacional. Os modelos de IA são compactos o suficiente para serem usados ​​em ambientes de baixa latência, mas ainda são capazes de resolver problemas que exigem construção lógica rigorosa e resultados confiáveis. Anteriormente, tais tarefas eram típicas apenas para IAs muito maiores.

avalanche

Postagens recentes

A Xiaomi inaugurou uma fábrica gigantesca e totalmente automatizada de eletrodomésticos inteligentes em Wuhan.

Durante a apresentação do smartphone Xiaomi 17 Ultra em 25 de dezembro de 2025, a…

20 minutos atrás

Hackers invadiram o Rainbow Six Siege e organizaram um sorteio gratuito — a Ubisoft desligou os servidores do jogo.

O popular jogo de tiro tático online Tom Clancy's Rainbow Six Siege, da desenvolvedora e…

3 horas atrás

Na China, foi identificado o melhor carro elétrico para dirigir em clima frio – a Tesla ficou apenas em quarto lugar.

O maior teste de inverno de veículos elétricos realizado na China oferece uma nova perspectiva…

4 horas atrás

Uma placa de vídeo por mão: o Japão começou a restringir as vendas das GeForce RTX 5000 e Radeon RX 9000 devido à escassez de memória.

A escassez global de memória RAM e flash está se agravando constantemente, afetando setores que…

4 horas atrás

China divulga regras rígidas para IA que “se comporta como humanos”

A Administração do Ciberespaço da China (CAC) divulgou uma minuta de medidas para regulamentar os…

6 horas atrás

O ChatGPT em breve contará com publicidade – seu formato foi revelado.

Surgiram relatos na mídia de que a OpenAI está considerando veicular anúncios de "conteúdo patrocinado"…

6 horas atrás