A Microsoft atualizou a versão web do Copilot, bem como as versões para Windows e dispositivos móveis de seu assistente de IA, com o modelo mais poderoso da OpenAI até o momento, o GPT-5.2. Ele permite a execução mais rápida de tarefas do mundo real, incluindo a criação de planilhas e apresentações, a escrita e revisão de código, a compreensão de documentos longos, o uso de ferramentas e o trabalho com imagens. Após a atualização, o GPT-5.2 coexistirá com o GPT-5.1.
Fonte da imagem: Microsoft
No mês passado, o assistente de IA Copilot foi atualizado para o GPT-5.1 em seu modo Smart. Agora, a Microsoft está adicionando o GPT-5.2 ao Copilot como um novo modo Smart Plus. O GPT-5.2 no Copilot parece ser uma variante do GPT-5.2 focada em raciocínio, já que a Microsoft enfatizou seu desempenho superior em tarefas complexas.
Na métrica GDPval da OpenAI, uma nova medida do desempenho de um modelo em tarefas economicamente significativas e do mundo real em 44 profissões, o GPT-5.2 Thinking supera ou se compara a profissionais do setor em 70,9% das vezes, em comparação com 38,8% para o GPT-5. Este é um salto enorme, e é por isso que a OpenAI classifica o GPT-5.2 como de “nível especialista” para muitas tarefas de escritório bem definidas, como apresentações e processamento de gráficos.
Fonte da imagem: unsplash.com
Em benchmarks projetados para avaliar agentes de IA em tarefas complexas de engenharia de software, o GPT-5.2 Thinking obteve 55,6% no SWE-Bench Pro e 80% no SWE-Bench Verified, resultados superiores ao GPT-5.1 Thinking. No teste especializado GPQA Diamond, o GPT-5.2 Thinking alcançou 92,4%, 100% no AIME 2025 e 88,7% no CharXiv Reasoning (com Python).
A nova versão do GPT também demonstrou melhorias significativas nos testes ARC-AGI (Abstract and Reasoning Corpus for Artificial General Intelligence) e ARC-AGI-2, que avaliam as habilidades de pensamento abstrato e raciocínio do modelo.
A HKC anunciou uma nova tela para laptop que suporta tecnologia de taxa de atualização…
O aumento contínuo dos preços da memória RAM em meio ao boom da inteligência artificial…
A Maxon lançou o Cinebench 2026, a versão mais recente de sua ferramenta de benchmark…
Um incidente ocorreu no laboratório de testes da empresa chinesa Unitree durante um treinamento de…
O observatório espacial SPHEREx da NASA concluiu seu primeiro levantamento completo do céu menos de…
A GOG, loja de distribuição digital pertencente à empresa polonesa CD Projekt, está entrando em…