Categorias: Mercado de tecnologia e TI. notíciaNotícias da rede

Microsoft revela três novos modelos de IA de pequeno porte na família Phi-4

A Microsoft lançou três novos modelos de linguagem pequena (SLMs) sob uma licença aberta: Phi-4-mini-reasoning, Phi-4-reasoning e Phi-4-reasoning-plus. Cada um dos modelos pertence à classe de modelos de raciocínio, focados na verificação lógica de decisões e na elaboração cuidadosa de problemas complexos. Esses modelos de IA são uma continuação da iniciativa da Microsoft de desenvolver sistemas compactos de IA, a família Phi, introduzida pela primeira vez há um ano como base para aplicativos executados em dispositivos com capacidades de computação limitadas.

Fonte da imagem: Jackson Sophat / Unsplash

O mais produtivo dos modelos de IA apresentados é o Phi-4-reasoning-plus. É uma adaptação do Phi-4 lançado anteriormente para tarefas de inferência lógica. De acordo com a Microsoft, sua qualidade de resposta é próxima à do DeepSeek R1, apesar de uma diferença significativa no volume de parâmetros: o DeepSeek R1 tem 671 bilhões, enquanto o Phi-4-reasoning-plus tem significativamente menos. De acordo com os testes internos da Microsoft, o modelo teve um desempenho de acordo com o modelo de IA o3-mini da OpenAI no benchmark OmniMath, que avalia as habilidades matemáticas da IA.

Os modelos Phi-4-reasoning e Phi-4-reasoning-plus (14 bilhões de parâmetros) demonstram superioridade sobre o Phi-4 de base e competem com confiança com sistemas maiores, incluindo DeepSeek-R1 Distill (70 bilhões de parâmetros) e OpenAI o3-mini, em tarefas de raciocínio matemático e lógico (AIME, HMMT, OmniMath, GPQA). Fonte da imagem: Microsoft

O modelo de raciocínio Phi-4 contém 14 bilhões de parâmetros e foi treinado com dados de “qualidade” da internet, bem como exemplos de demonstração selecionados do o3-mini. Ele é otimizado para tarefas em matemática, ciências e programação. Assim, o raciocínio Phi-4 é focado na computação de alta precisão e na interpretação analítica de dados, ao mesmo tempo em que permanece relativamente compacto e acessível para uso em plataformas de computação locais.

Em benchmarks de uso geral, incluindo FlenQA, IFEval, HumanEvalPlus, MMLUPro, ToxiGen e PhiBench, os modelos Phi-4-reasoning-plus demonstram precisão comparável ao GPT-4o e o3-mini, apesar de terem um tamanho de parâmetro menor (14 bilhões de parâmetros), especialmente em tarefas de programação, lógica e segurança. Fonte da imagem: Microsoft

Phi-4-mini-raciocínio é o menor dos SLMs apresentados. Seu tamanho é de cerca de 3,8 bilhões de parâmetros. Ele foi treinado em aproximadamente 1 milhão de problemas matemáticos sintéticos gerados pelo modelo de IA R1 da startup chinesa DeepSeek. A Microsoft o posiciona como um modelo de IA para cenários educacionais, incluindo “aprendizagem incorporada” em dispositivos móveis e de baixo consumo de energia. Devido à sua compactação e precisão, este modelo de IA pode ser usado em sistemas de aprendizagem interativos onde a velocidade de resposta e os recursos de computação limitados são uma prioridade.

O Phi-4-mini-reasoning (3,8 bilhões de parâmetros) supera significativamente sua linha de base e modelos com o dobro do tamanho nos benchmarks AIME 24, MATH-500 e GPQA Diamond, e é comparável ou melhor que o OpenAI o1-mini em precisão de geração de respostas matemáticas longas. Fonte da imagem: Microsoft

Todos os três modelos de IA estão disponíveis na plataforma Hugging Face e são distribuídos sob uma licença aberta. De acordo com a Microsoft, eles foram treinados usando destilação, aprendizado de reforço e dados de treinamento de alta qualidade. Esses métodos permitiram equilibrar o tamanho dos SLMs e seu desempenho computacional. Os modelos de IA são compactos o suficiente para serem usados em ambientes de baixa latência, mas ainda são capazes de resolver problemas que exigem construção lógica rigorosa e resultados confiáveis. Anteriormente, tais tarefas eram típicas apenas para IAs muito maiores.

avalanche

Próximo Público mensal do WhatsApp ultrapassa 3 bilhões de usuários »

Anterior « Zuckerberg se gabou de que a audiência mensal do Threads ultrapassou 350 milhões — ainda está muito longe do X

Deixar comentário

Publicado por

avalanche

11 meses atrás

Postagens recentes

Carros, motos, veículos

A Yandex está se preparando para um lançamento em massa de robotáxis e carros autônomos até 2028.

A Yandex planeja começar a comercializar veículos robóticos em 2028, tanto no setor de táxis…

25 minutos atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

Golpistas começaram a disfarçar malware como código-fonte vazado do Anthropic Claude Code.

Esta semana, o código-fonte do serviço Claude Code da Anthropic vazou — a empresa tomou…

38 minutos atrás

Módulos de RAM, cartões de memória, pen drives, leitores de cartões

A JEDEC permitirá o crescimento da memória HBM4E para simplificar a produção e reduzir custos.

A memória empilhada, chamada HBM, é considerada uma das mais rápidas do mercado, mas continua…

38 minutos atrás

Meio Ambiente

Uma startup suíça transformou baterias usadas em baterias domésticas por assinatura.

A startup suíça Evolium Technologies, fundada em 2024 com o apoio da Associação Suíça de…

50 minutos atrás

Espaço

Um modelo chinês do foguete reutilizável Falcon 9 da SpaceX explodiu no ar — ele era movido a querosene produzido a partir do carvão.

Hoje, às 12h17, horário de Pequim (7h17, horário de Moscou), o foguete experimental Tianlong-3, da…

2 horas atrás

A Oracle finalmente encontrou os recursos para construir outro centro de dados de IA OpenAI Stargate.

A Related Digital, investidora em data centers, está perto de fechar um acordo de US$…