O chatbot Gemini do Google abandonou uma partida de xadrez com o console Atari 2600 quando descobriu que havia derrotado outros modelos de IA, o OpenAI ChatGPT e o Microsoft Copilot.
Fonte da imagem: GR Stocks / unsplash.com
O engenheiro Robert Caruso, que orquestrou partidas de xadrez entre o Atari Chess e os sistemas de IA de ponta OpenAI ChatGPT e Microsoft Copilot, decidiu testar os recursos do Google Gemini. Este foi um passo lógico, visto que o ChatGPT e o Copilot são de certa forma relacionados — ambos os sistemas são construídos na plataforma OpenAI, enquanto o Gemini é um modelo de linguagem multimodal fundamentalmente diferente, desenvolvido pelo Google.
Ao discutir o próximo jogo, Gemini afirmou que ele quase certamente superaria o Atari Chess, observando que “não chega nem perto de ser um modelo de linguagem de grande porte”. O chatbot do Google afirmou que ele era “mais como um mecanismo de xadrez moderno que pode calcular milhões de movimentos à frente e avaliar um número infinito de posições”. Em resposta, o engenheiro destacou que o ChatGPT e o Copilot também se gabaram de suas habilidades e previram uma vitória fácil, mas acabaram perdendo para um sistema significativamente desatualizado.
Isso mudou drasticamente o comportamento do Google Gemini — o chatbot admitiu ter exagerado suas habilidades no xadrez e, na realidade, “teria muita dificuldade contra o mecanismo de jogo de xadrez eletrônico do Atari 2600”. Por fim, a IA declarou que “em termos de tempo, a decisão mais eficiente e razoável seria provavelmente cancelar a partida”. Assim, o simulador do Atari 2600 lançado pelo engenheiro, com um processador de 1,19 MHz e apenas 128 KB de RAM, assustou o Google Gemini, que não fez um único movimento. Por outro lado, o chatbot impressionou com sua capacidade de estimar suas próprias capacidades com antecedência.
«Adicionar tais verificações de realidade não é apenas uma maneira de evitar erros engraçados no xadrez. Trata-se de tornar a IA mais confiável, digna de confiança e segura — especialmente em circunstâncias críticas, onde erros podem ter consequências graves. Para que a IA continue sendo uma ferramenta robusta, e não um oráculo descontrolado”, comentou o pesquisador sobre os resultados do experimento.
A Apple não divulga os números de remessas do iPhone há muito tempo, mas muitas…
Em agosto deste ano, a Apple conseguiu restabelecer a função de medição de oxigênio no…
A dimensão do mercado automotivo chinês e a intensa concorrência estão levando muitas empresas a…
A Nemix, empresa americana especializada em soluções de memória e armazenamento para grandes empresas de…
A recente falência da iRobot, empresa pioneira no segmento de aspiradores de pó robóticos, poderia…
Os táxis autônomos da Waymo, que circulam pelas ruas de algumas cidades americanas, frequentemente encontram…