Uma equipe de pesquisadores, incluindo pesquisadores de Stanford, cientistas do Imperial College London e entusiastas do Internet Archive, publicou suas descobertas em um artigo intitulado “O Impacto do Texto Gerado por IA na Internet”. De acordo com suas conclusões, mais de um terço de todos os sites serão criados usando IA até 2022. O estudo também constatou que o conteúdo gerado por IA torna a internet mais positiva e menos diversa.

Fonte da imagem: unsplash.com

Inspirada pela teoria da “internet morta” — a ideia de que grande parte da internet agora consiste em chatbots — uma equipe de pesquisadores recorreu ao Internet Archive para obter amostras de sites durante 33 meses, de agosto de 2022 a maio de 2025. O Internet Archive é uma organização sem fins lucrativos que, como o nome sugere, se dedica a preservar o conteúdo digital da web para as gerações futuras.

“Para cada URL selecionada, recuperamos o snapshot arquivado mais antigo disponível por meio da API CDX Wayback Machine”, afirma o estudo. “O código-fonte HTML de cada snapshot é baixado e armazenado localmente para processamento posterior.” Os pesquisadores utilizaram o software de detecção de IA Pangram v3, que consideraram a ferramenta mais precisa para identificar conteúdo gerado por redes neurais.

“Há preocupações com a proliferação de textos gerados e processados ​​por IA online, o que pode levar a um declínio na diversidade semântica e estilística, na precisão factual e a outras consequências negativas”, escrevem os pesquisadores. “Descobrimos que, em meados de 2025, aproximadamente 35% dos sites recém-publicados foram classificados como gerados ou processados ​​por IA, em comparação com zero antes do lançamento do ChatGPT no final de 2022.”

“Acho simplesmente impressionante a velocidade incrível com que a IA está dominando a internet”, disse Jonáš Doležal, pesquisador de IA de Stanford e coautor do artigo. “Após décadas de humanos moldando a internet…””A internet, cuja maior parte foi moldada pela inteligência artificial em apenas três anos, tornou-se uma realidade. Na minha opinião, estamos testemunhando uma transformação massiva do cenário digital em muito menos tempo do que o necessário para criá-lo.”

Os pesquisadores testaram seis críticas comuns ao texto gerado por IA:

“Para cada hipótese, identificamos um sinal mensurável, calculamos para cada amostra mensal de sites e testamos se ele se correlaciona com a pontuação cumulativa de probabilidade de IA ao longo dos meses”, explicaram os cientistas. Por exemplo, para testar se a IA estava inundando a internet com informações falsas, a equipe extraiu afirmações factuais dos sites selecionados e verificou sua veracidade. Para determinar se a IA estava citando fontes, a equipe calculou a densidade de links externos no texto gerado por IA.

Para surpresa dos pesquisadores, apenas duas das seis teorias sobre a influência do texto gerado por IA que testaram estavam corretas. A IA tornou a internet menos semanticamente diversa e, em geral, mais positiva, mas não causou a disseminação de informações falsas nem eliminou suas fontes.

” “O resultado mais surpreendente foi que nossa hipótese de deterioração da verdade não foi confirmada”, observou Doležal. “Procuramos especificamente por um aumento em declarações patentemente falsas, mas não encontramos nenhuma. No entanto, ainda é possível que a IA esteja silenciosamente aumentando o volume de declarações que não podem ser verificadas usando as ferramentas e a infraestrutura de checagem de fatos existentes. Ou talvez a internet nunca tenha sido particularmente propensa a dizer a verdade.”

Os pesquisadores afirmaram:Eles continuarão a estudar o impacto do conteúdo de IA na internet. Atualmente, estão desenvolvendo uma “ferramenta contínua” que analisará a situação constantemente, em vez de criar um “instantâneo” estático dos recursos online. Os cientistas planejam determinar quais tipos de sites são mais populosos com conteúdo de redes neurais, divididos por categoria e idioma, e avaliar onde os efeitos da IA ​​são mais pronunciados.

Para Dolezal, essa pesquisa é crucial para garantir uma internet útil e produtiva. “À medida que o conteúdo gerado por IA prolifera, o desafio é encontrar usos para esses modelos que não resultem simplesmente na criação de conteúdo higienizado e repetitivo”, afirma. “Em vez de forçar os modelos a serem perfeitamente obedientes e submissos, devemos dar-lhes mais personalidade ou conflito, o que pode ajudá-los a atuar como parceiros criativos em vez de substitutos da voz humana.”

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *