O modelo o3 da OpenAI derrotou o modelo Grok 4 da xAI por 4 a 0 na final do torneio de xadrez Kaggle AI Exhibition, segundo o The Independent. Outros modelos de IA competindo incluíram Anthropic, DeepSeek, Google e Moonshot AI. O confronto final assumiu um significado especial devido à relação extremamente tensa entre os cofundadores da OpenAI, Sam Altman, e Elon Musk, que tentou adquirir a empresa após deixar a OpenAI.

Fonte da imagem: Steve Johnson/Unsplash

Na rodada final do torneio, o o3 demonstrou um jogo impecável, vencendo todas as quatro partidas contra o Grok 4. Ambos os sistemas avançaram para a rodada final após derrotar seus concorrentes nas rodadas anteriores. Em resposta à derrota do Grok 4 no xadrez, Musk afirmou que a jogabilidade do modelo era um “efeito adicional” e não uma prioridade em seu desenvolvimento.

A capacidade dos computadores de derrotar os melhores enxadristas do mundo é conhecida desde 1997, quando o supercomputador Deep Blue, da IBM, derrotou Garry Kasparov. Posteriormente, o Google DeepMind criou um modelo de IA capaz de aprender a jogar xadrez e Go por conta própria. Mas o novo torneio foi a primeira grande competição a testar modelos de grandes linguagens (LLMs) como o ChatGPT.

O CEO e cofundador da Take Take Take, Mats André Kristiansen, observou que, embora a partida de Kasparov contra o Deep Blue tenha sido um grande evento na década de 1990, o principal valor do torneio atual está em explorar como os modelos modernos de IA raciocinam e tomam decisões.

Curiosamente, em julho, o atual campeão mundial de xadrez, Magnus Carlsen, derrotou o ChatGPT em uma partida online sem perder uma única peça. Comentando sobre a final entre Grok e o3, Carlsen estimou o rating de Grok em cerca de 800, e o de o3 em 1200. Para efeito de comparação, seu próprio rating máximo é 2882. Em resposta a uma pergunta do usuário X, o próprio Grok estimou seu nível entre 1600 e 1800.

admin

Postagens recentes

A AnTuTu nomeou os smartphones Android mais poderosos de abril, com o iQOO 15 Ultra na liderança.

No início de cada mês, os desenvolvedores do popular benchmark para dispositivos móveis AnTuTu publicam…

4 horas atrás

Pragmata — Pai Espacial. Análise / Jogos

Intel Core i5-8500 4.1 GHz / AMD Ryzen 5 3500 3.6 GHz, 16 GB de…

4 horas atrás

Pragmata — Pai Espacial. Resenha

Intel Core i5-8500 4.1 GHz / AMD Ryzen 5 3500 3.6 GHz, 16 GB de…

4 horas atrás

Steam to Electric, o simulador de magnata ferroviário com trens malucos, porém historicamente precisos, foi anunciado – primeiro trailer e detalhes.

A editora Kwalee e os desenvolvedores do estúdio holandês Galaxy Grove (Station to Station), que…

7 horas atrás

A Virgin Galactic revelou uma espaçonave em construção para turistas, com lançamento previsto para o final de 2026.

A Virgin Galactic publicou uma foto de sua nova espaçonave sendo retirada do hangar de…

7 horas atrás

Os desenvolvedores de Subnautica 2 revelaram os requisitos de sistema antes do Acesso Antecipado e prometeram otimizar o jogo.

O simulador de sobrevivência subaquática Subnautica 2 está prestes a entrar em Acesso Antecipado, e…

9 horas atrás