O modelo o3 da OpenAI derrotou o modelo Grok 4 da xAI por 4 a 0 na final do torneio de xadrez Kaggle AI Exhibition, segundo o The Independent. Outros modelos de IA competindo incluíram Anthropic, DeepSeek, Google e Moonshot AI. O confronto final assumiu um significado especial devido à relação extremamente tensa entre os cofundadores da OpenAI, Sam Altman, e Elon Musk, que tentou adquirir a empresa após deixar a OpenAI.

Fonte da imagem: Steve Johnson/Unsplash

Na rodada final do torneio, o o3 demonstrou um jogo impecável, vencendo todas as quatro partidas contra o Grok 4. Ambos os sistemas avançaram para a rodada final após derrotar seus concorrentes nas rodadas anteriores. Em resposta à derrota do Grok 4 no xadrez, Musk afirmou que a jogabilidade do modelo era um “efeito adicional” e não uma prioridade em seu desenvolvimento.

A capacidade dos computadores de derrotar os melhores enxadristas do mundo é conhecida desde 1997, quando o supercomputador Deep Blue, da IBM, derrotou Garry Kasparov. Posteriormente, o Google DeepMind criou um modelo de IA capaz de aprender a jogar xadrez e Go por conta própria. Mas o novo torneio foi a primeira grande competição a testar modelos de grandes linguagens (LLMs) como o ChatGPT.

O CEO e cofundador da Take Take Take, Mats André Kristiansen, observou que, embora a partida de Kasparov contra o Deep Blue tenha sido um grande evento na década de 1990, o principal valor do torneio atual está em explorar como os modelos modernos de IA raciocinam e tomam decisões.

Curiosamente, em julho, o atual campeão mundial de xadrez, Magnus Carlsen, derrotou o ChatGPT em uma partida online sem perder uma única peça. Comentando sobre a final entre Grok e o3, Carlsen estimou o rating de Grok em cerca de 800, e o de o3 em 1200. Para efeito de comparação, seu próprio rating máximo é 2882. Em resposta a uma pergunta do usuário X, o próprio Grok estimou seu nível entre 1600 e 1800.

admin

Postagens recentes

A aventura medieval com bordados, Scarlet Deer Inn, não vai demorar a chegar – um novo trailer e a data de lançamento no Steam já estão disponíveis.

Os desenvolvedores do estúdio tcheco Attu Games (Feudal Alloy) anunciaram a data de lançamento de…

40 minutos atrás

O Japão lançou com sucesso o veículo de lançamento H3 em sua configuração mais leve.

Em 12 de junho de 2026, o novo veículo de lançamento H3 foi lançado do…

53 minutos atrás

A China lançou um de seus veículos de lançamento mais pesados, cuja carga útil alegada deixou os especialistas perplexos.

Em 11 de junho de 2026, às 15h30, horário de Pequim (10h30, horário de Moscou),…

1 hora atrás

O Telegram agora conta com clientes para smartwatch, suporte para formatação de bots, moderação por IA em grupos e muito mais.

Com a atualização mais recente, o Telegram Messenger recebeu novos aplicativos para Apple Watch e…

1 hora atrás

O presidente da TSMC reclamou que as maiores carências da empresa são de pessoal e água.

Na assembleia anual de acionistas, o presidente da TSMC, C.C. Wei, já havia admitido que…

2 horas atrás