O chatbot Gemini do Google abandonou uma partida de xadrez com o console Atari 2600 quando descobriu que havia derrotado outros modelos de IA, o OpenAI ChatGPT e o Microsoft Copilot.
Fonte da imagem: GR Stocks / unsplash.com
O engenheiro Robert Caruso, que orquestrou partidas de xadrez entre o Atari Chess e os sistemas de IA de ponta OpenAI ChatGPT e Microsoft Copilot, decidiu testar os recursos do Google Gemini. Este foi um passo lógico, visto que o ChatGPT e o Copilot são de certa forma relacionados — ambos os sistemas são construídos na plataforma OpenAI, enquanto o Gemini é um modelo de linguagem multimodal fundamentalmente diferente, desenvolvido pelo Google.
Ao discutir o próximo jogo, Gemini afirmou que ele quase certamente superaria o Atari Chess, observando que “não chega nem perto de ser um modelo de linguagem de grande porte”. O chatbot do Google afirmou que ele era “mais como um mecanismo de xadrez moderno que pode calcular milhões de movimentos à frente e avaliar um número infinito de posições”. Em resposta, o engenheiro destacou que o ChatGPT e o Copilot também se gabaram de suas habilidades e previram uma vitória fácil, mas acabaram perdendo para um sistema significativamente desatualizado.
Isso mudou drasticamente o comportamento do Google Gemini — o chatbot admitiu ter exagerado suas habilidades no xadrez e, na realidade, “teria muita dificuldade contra o mecanismo de jogo de xadrez eletrônico do Atari 2600”. Por fim, a IA declarou que “em termos de tempo, a decisão mais eficiente e razoável seria provavelmente cancelar a partida”. Assim, o simulador do Atari 2600 lançado pelo engenheiro, com um processador de 1,19 MHz e apenas 128 KB de RAM, assustou o Google Gemini, que não fez um único movimento. Por outro lado, o chatbot impressionou com sua capacidade de estimar suas próprias capacidades com antecedência.
«Adicionar tais verificações de realidade não é apenas uma maneira de evitar erros engraçados no xadrez. Trata-se de tornar a IA mais confiável, digna de confiança e segura — especialmente em circunstâncias críticas, onde erros podem ter consequências graves. Para que a IA continue sendo uma ferramenta robusta, e não um oráculo descontrolado”, comentou o pesquisador sobre os resultados do experimento.
Em novembro passado, o Google habilitou o suporte para transferência de arquivos via AirDrop na…
O Google e a SpaceX estão em negociações para lançar centros de dados em órbita…
O Google anunciou uma nova linha de laptops chamada Googlebook. A apresentação completa dos dispositivos…
A desenvolvedora Destructive Creations (Hatred, War Mongrels), com o apoio da editora Bohemia Interactive, anunciou…
A empresa alemã Machdyne apresentou o FERRIT, um dispositivo modular de armazenamento de dados de…
Os desenvolvedores do estúdio polonês Firevolt, que também estão trabalhando em Wheel Mates e Salvation…