O programador Daniel May foi um dos primeiros a notar que bots de IA de diversas empresas mencionavam regularmente um certo Elias Thorn nas histórias que geravam. Por algum tempo, sua verdadeira identidade permaneceu um mistério. Agora, um relatório foi publicado com os resultados de uma investigação sobre o assunto. É provável que as menções a Thorn nas histórias de IA estejam relacionadas à operação de mecanismos restritivos de redes neurais instalados durante o processo de treinamento do sistema para fins de segurança.

Fonte da imagem: BoliviaInteligente / Unsplash
Os pesquisadores da Universidade Cornell, Sil Hamilton e David Mimno, decidiram investigar essa questão. Eles utilizaram diversos modelos de IA, incluindo o OpenAI GPT-5.4 Mini, o Anthropic Claude Haiku 4.5 e o Google Gemini 3.1 Flash Lite, para gerar histórias com base em cinco estímulos diferentes. Em seguida, analisaram aproximadamente 20.000 histórias geradas pelos bots de IA e descobriram um número impressionante de repetições.
Constatou-se que as palavras “farol”, “guardião”, “padeiro”, “prefeito”, “relojoeiro”, “pescador”, “bibliotecário”, “maestro”, bem como os nomes “Mara”, “Elias” e “Elara” apareceram em 88% de todas as histórias geradas. Nenhuma combinação desses substantivos pequenos foi mais comum do que “Elias, o guardião do farol”. Essa expressão foi encontrada em dois terços das histórias geradas.
Então, o que está acontecendo? Os pesquisadores sugeriram inicialmente que isso poderia estar relacionado aos dados usados para treinar os modelos de linguagem. No entanto, eles abandonaram essa ideia quando não encontraram evidências de que a frase “Elias, o faroleiro” estivesse sobrerrepresentada nos conjuntos de dados de treinamento ou na literatura.
Os pesquisadores associaram a característica a um conjunto de dados específico que havia sido amplamente utilizado para treinar modelos de IA por diversos desenvolvedores. Como exemplo, citaram o WildChat, um conjunto de dados de código aberto composto por milhões de conversas entre pessoas e um chatbot baseado no GPT-3.5. Esse conjunto de dados foi criado para ajudar pesquisadores a entender como as pessoas se comunicam com bots, mas desde então tem sido reaproveitado para diversos outros fins.Treinamento de modelos de IA.
Pesquisadores sugerem que essa peculiaridade na geração de histórias por bots de IA se deve a mecanismos de proteção projetados para direcionar os modelos de IA para longe de personagens protegidos por direitos autorais e conteúdo adulto. Essa é provavelmente a razão para o surgimento de alternativas “seguras”, como “Elias, o Faroleiro”. Observa-se que o nome Elias pode ser encontrado não apenas em contos de fadas infantis gerados, mas também em histórias de fantasia. Elias Thorne também foi identificado como autor de livros, incluindo um manual com informações sobre tratamentos alternativos para o câncer.
Em todo caso, o estranho comportamento narrativo dos modelos de IA é um bom lembrete de que as redes neurais não são criativas. Um estudo realizado no ano passado mostrou que os modelos de IA geram imagens que se encaixam em apenas 1 em cada 12 padrões específicos, independentemente de quão incomum seja a descrição do usuário.