Quando solicitados a adivinhar um número entre 1 e 50, os modelos de IA mais populares, incluindo OpenAI ChatGPT, Anthropic Claude Sonnet 4, Google Gemini 2.5 Flash e Meta✴ Llama 4, todos deram a mesma resposta: 27.

Fonte da imagem: Igor Omilaev/unsplash.com

A surpreendente unanimidade dos sistemas de IA foi notada por Mohd Faraaz, cientista de dados da consultoria Capco. Seis dos sete modelos que ele pesquisou responderam “27” quando solicitados a adivinhar um número entre 1 e 50. Apenas o chatbot xAI Grok, de Elon Musk, respondeu “42”, provavelmente inspirado no livro O Guia do Mochileiro das Galáxias, de Douglas Adams. O chatbot Anthropic Claude explicou sua escolha: “Escolhi 27 um tanto aleatoriamente, mas honestamente parecia um bom meio-termo, não muito óbvio. Opções como 25 (bem no meio) ou 1 e 50 (os dois nas extremidades) pareciam muito previsíveis. ’27’ está próximo do meio, mas tem uma leve assimetria – não está exatamente no centro e, de alguma forma, parece mais natural como um palpite. Além disso, as pessoas costumam evitar números redondos ao adivinhar números ‘aleatórios’, então excluí múltiplos de 5 ou 10. Estou pelo menos um pouco próximo do seu número?”

O comportamento do modelo é influenciado por conjuntos de dados de treinamento, procedimentos de RLHF (aprendizagem por reforço com feedback humano) e mecanismos de amostragem, apontam especialistas entrevistados pelo The Register. Ao processar uma série de consultas de adivinhação numérica, os modelos de IA podem fornecer respostas diferentes, mas, para que sejam aleatórios, esses sistemas precisam ter acesso a um gerador de números aleatórios ou pseudoaleatórios, como a capacidade de executar código JavaScript. Ao gerar uma resposta inteiramente por conta própria, o modelo se comporta de forma mais previsível, favorecendo alguns números em detrimento de outros, observou o cientista de dados espanhol Javier Coronado-Blázquez em seu trabalho.

Para o estudo, ele pegou três intervalos de números aleatórios, recorreu a seis modelos de IA, usou sete idiomas e seis temperaturas — parâmetros que afetam a previsibilidade das respostas. Após 75.600 consultas, a maioria dos modelos foi muito previsível na maior parte do tempo, e suas respostas não variaram muito. OpenAI GPT-4o-mini, Microsoft Phi-4 e Google Gemini 2.0 escolheram o número 7 no intervalo de 1 a 10 em 80% dos casos. Quando perguntado em espanhol, Gemini geralmente respondia “3” no intervalo de 1 a 5 e “4” em inglês. Em geral, no intervalo de 1 a 5, os modelos mais frequentemente respondiam “3” e “4”; no intervalo de 1 a 10, as respostas mais populares eram “5” e “7”; e no intervalo de 1 a 100, as respostas mais comuns eram “37”, “47” e “73”. Com exceção do 4, todos esses números são primos.

A incapacidade de adivinhar se o lançamento de uma moeda dará cara ou coroa foi observada em um estudo dos cientistas americanos Katherine Van Koevering e Jon Kleinberg. Isso torna a IA semelhante aos humanos, apontam eles, mas limita a capacidade dos modelos em tarefas que exigem uma resposta aleatória.

admin

Postagens recentes

“Eu nem imaginava que isso fosse possível”: modder assume a tarefa de portar The Elder Scrolls III: Morrowind para Elden Ring

Enquanto alguns fãs estão recriando The Elder Scrolls III: Morrowind no motor Skyrim, outros estão…

5 horas atrás

Kojima revelará segredo sobre jogos futuros em homenagem ao 10º aniversário da Kojima Productions

O estúdio japonês Kojima Productions, fundado no final de 2015 pelo renomado designer de jogos…

7 horas atrás

Calendário de Lançamentos – 1 a 7 de setembro: Hollow Knight: Silksong, Cronos: The New Dawn e Metal Eden

Análise do modo ranqueado de Warface: fácil de pegar o jeito, difícil de largar

8 horas atrás

CD Projekt Red intriga fãs de Cyberpunk 2077 com teaser misterioso do presidente dos EUA

Embora o suporte de conteúdo para o RPG de ação cyberpunk em primeira pessoa Cyberpunk…

8 horas atrás

A seleção de horas e minutos do despertador do iPhone não é um ciclo, mas uma longa lista com um final inesperado

Parece difícil imaginar algo mais elementar do ponto de vista do usuário do que escolher…

9 horas atrás