A inteligência artificial está sendo cada vez mais utilizada na escrita científica, mas medir sua presença de forma confiável é difícil, apontam os pesquisadores. Uma coisa é certa: o volume desse conteúdo continuará a crescer, de acordo com um artigo da revista Nature.

Fonte da imagem: Markus Winkler / unsplash.com
A preocupação da comunidade científica com a escala do conteúdo científico gerado por IA reflete tendências mais amplas na internet. No final de março, o número de artigos escritos com auxílio de IA ultrapassou o número de artigos gerados por humanos, segundo pesquisadores da Graphite, que analisaram 55 mil novas páginas da web. A IA tem potencial para ser usada na criação de literatura científica e pode acelerar o processo de pesquisa, mas também pode gerar artigos de baixa qualidade. Para avaliar a dimensão do problema, os cientistas estão recorrendo a ferramentas de detecção de conteúdo por IA, embora estas não sejam totalmente confiáveis: algumas ferramentas disponíveis não conseguem distinguir entre textos que foram simplesmente editados por IA e textos que foram inteiramente gerados por ela. Falsos positivos também ocorrem, em que textos escritos por humanos são rotulados como gerados por IA.
Os resultados de um estudo conduzido com uma ferramenta desenvolvida pela Pangram Labs são indicativos disso. O projeto examinou 7.000 artigos científicos e 8.000 revisões submetidos à revista Organization Science entre janeiro de 2021 e fevereiro de 2026. Constatou-se que, desde novembro de 2022, quando o ChatGPT foi lançado, o número total de artigos aumentou 42%; também se verificou que esse aumento se deveu principalmente à participação da IA. Do início de 2024 a fevereiro de 2026, o número de artigos com mais de 70% de texto gerado por IA mais que dobrou; 30% das revisões também continham texto gerado por IA. Outro estudo examinou aproximadamente 5.000 artigos biomédicos publicados nas revistas científicas Science,As revistas Nature e Cell foram analisadas usando a ferramenta de detecção de conteúdo por IA, Pangram. Os resultados mostraram que seis artigos foram escritos inteiramente por IA e que um em cada oito artigos continha algum grau de texto gerado por IA.

Fonte da imagem: Igor Omilaev / unsplash.com
Em um terceiro estudo, pesquisadores utilizaram dois detectores de IA para analisar mais de 124.000 manuscritos publicados na plataforma arXiv entre 2020 e 2025. Na área de ciência da computação, a proporção de artigos de revisão escritos com o auxílio de IA aumentou de 7% em 2023 para 43% em 2025. A proporção de artigos de pesquisa originais nessa área que continham texto gerado por IA aumentou de 3% para 23% no mesmo período. Os autores deste estudo não diferenciaram entre artigos que utilizavam IA parcialmente na pesquisa e aqueles escritos inteiramente por IA; a qualidade dos próprios artigos também não foi avaliada.
Um aspecto significativo do problema é a falta de ferramentas precisas e confiáveis capazes de determinar com exatidão qual a proporção da literatura científica, no geral, que é gerada por IA. À medida que os modelos de IA melhoram, o mesmo deve acontecer com os detectores de texto que utilizam IA. Com o tempo, o número de mecanismos que os humanos usarão para “humanizar” esses materiais e burlar esses detectores aumentará. Outro método é a introdução de “marcas d’água” que indicam claramente o envolvimento de IA na criação do texto. Essa tecnologia contribuiu recentemente para a rejeição de 497 artigos submetidos a uma conferência científica.