O chatbot Gemini do Google abandonou uma partida de xadrez com o console Atari 2600 quando descobriu que havia derrotado outros modelos de IA, o OpenAI ChatGPT e o Microsoft Copilot.
Fonte da imagem: GR Stocks / unsplash.com
O engenheiro Robert Caruso, que orquestrou partidas de xadrez entre o Atari Chess e os sistemas de IA de ponta OpenAI ChatGPT e Microsoft Copilot, decidiu testar os recursos do Google Gemini. Este foi um passo lógico, visto que o ChatGPT e o Copilot são de certa forma relacionados — ambos os sistemas são construídos na plataforma OpenAI, enquanto o Gemini é um modelo de linguagem multimodal fundamentalmente diferente, desenvolvido pelo Google.
Ao discutir o próximo jogo, Gemini afirmou que ele quase certamente superaria o Atari Chess, observando que “não chega nem perto de ser um modelo de linguagem de grande porte”. O chatbot do Google afirmou que ele era “mais como um mecanismo de xadrez moderno que pode calcular milhões de movimentos à frente e avaliar um número infinito de posições”. Em resposta, o engenheiro destacou que o ChatGPT e o Copilot também se gabaram de suas habilidades e previram uma vitória fácil, mas acabaram perdendo para um sistema significativamente desatualizado.
Isso mudou drasticamente o comportamento do Google Gemini — o chatbot admitiu ter exagerado suas habilidades no xadrez e, na realidade, “teria muita dificuldade contra o mecanismo de jogo de xadrez eletrônico do Atari 2600”. Por fim, a IA declarou que “em termos de tempo, a decisão mais eficiente e razoável seria provavelmente cancelar a partida”. Assim, o simulador do Atari 2600 lançado pelo engenheiro, com um processador de 1,19 MHz e apenas 128 KB de RAM, assustou o Google Gemini, que não fez um único movimento. Por outro lado, o chatbot impressionou com sua capacidade de estimar suas próprias capacidades com antecedência.
«Adicionar tais verificações de realidade não é apenas uma maneira de evitar erros engraçados no xadrez. Trata-se de tornar a IA mais confiável, digna de confiança e segura — especialmente em circunstâncias críticas, onde erros podem ter consequências graves. Para que a IA continue sendo uma ferramenta robusta, e não um oráculo descontrolado”, comentou o pesquisador sobre os resultados do experimento.
Enquanto alguns fãs estão recriando The Elder Scrolls III: Morrowind no motor Skyrim, outros estão…
O estúdio japonês Kojima Productions, fundado no final de 2015 pelo renomado designer de jogos…
A Apple deve lançar o primeiro iPhone com tela flexível, possivelmente chamado de iPhone Fold,…
Análise do modo ranqueado de Warface: fácil de pegar o jeito, difícil de largar
Embora o suporte de conteúdo para o RPG de ação cyberpunk em primeira pessoa Cyberpunk…
Parece difícil imaginar algo mais elementar do ponto de vista do usuário do que escolher…