A Microsoft adicionará o GPT-5.2 ao Copilot, um novo modelo que funcionará no modo Smart Plus.

A Microsoft atualizou a versão web do Copilot, bem como as versões para Windows e dispositivos móveis de seu assistente de IA, com o modelo mais poderoso da OpenAI até o momento, o GPT-5.2. Ele permite a execução mais rápida de tarefas do mundo real, incluindo a criação de planilhas e apresentações, a escrita e revisão de código, a compreensão de documentos longos, o uso de ferramentas e o trabalho com imagens. Após a atualização, o GPT-5.2 coexistirá com o GPT-5.1.

Fonte da imagem: Microsoft

No mês passado, o assistente de IA Copilot foi atualizado para o GPT-5.1 em seu modo Smart. Agora, a Microsoft está adicionando o GPT-5.2 ao Copilot como um novo modo Smart Plus. O GPT-5.2 no Copilot parece ser uma variante do GPT-5.2 focada em raciocínio, já que a Microsoft enfatizou seu desempenho superior em tarefas complexas.

Na métrica GDPval da OpenAI, uma nova medida do desempenho de um modelo em tarefas economicamente significativas e do mundo real em 44 profissões, o GPT-5.2 Thinking supera ou se compara a profissionais do setor em 70,9% das vezes, em comparação com 38,8% para o GPT-5. Este é um salto enorme, e é por isso que a OpenAI classifica o GPT-5.2 como de “nível especialista” para muitas tarefas de escritório bem definidas, como apresentações e processamento de gráficos.

Fonte da imagem: unsplash.com

Em benchmarks projetados para avaliar agentes de IA em tarefas complexas de engenharia de software, o GPT-5.2 Thinking obteve 55,6% no SWE-Bench Pro e 80% no SWE-Bench Verified, resultados superiores ao GPT-5.1 Thinking. No teste especializado GPQA Diamond, o GPT-5.2 Thinking alcançou 92,4%, 100% no AIME 2025 e 88,7% no CharXiv Reasoning (com Python).

A nova versão do GPT também demonstrou melhorias significativas nos testes ARC-AGI (Abstract and Reasoning Corpus for Artificial General Intelligence) e ARC-AGI-2, que avaliam as habilidades de pensamento abstrato e raciocínio do modelo.

admin

Compartilhar
Publicado por
admin

Postagens recentes

O Custo do Trabalho e o Poder de Compra no Brasil em 2026:A Verdade Brutal por Trás de um Salário de R$ 7.500

Existe uma mentira confortável repetida todos os dias no Brasil:“Fulano ganha R$ 7.500 por mês.”…

1 hora atrás

A Honor apresentou o MagicBook Pro 14 2026, um notebook fino de 14,6 polegadas baseado no processador Intel Panther Lake-H.

A Honor apresentou o notebook MagicBook Pro 14 2026. O novo modelo possui uma tela…

3 horas atrás

A Anthropic está contestando judicialmente sua inclusão na lista negra.

A Anthropic prometeu recorrer da decisão do Departamento de Defesa dos EUA de incluí-la em…

5 horas atrás

Os aplicativos de Smart TV estão consumindo dados da internet silenciosamente para treinar modelos de IA.

Empresas que coletam dados abertos da internet para treinar modelos de IA estão buscando cada…

6 horas atrás

O aplicativo Claude alcançou o topo das paradas da App Store depois que o governo dos EUA atacou a Anthropic.

O aplicativo Claude da Anthropic para dispositivos iOS alcançou o primeiro lugar no ranking de…

7 horas atrás