Cloudflare libera IA em bots que coletam dados para IA

A Cloudflare implantou um sistema de IA projetado para interceptar bots que rastreiam páginas públicas e coletam dados para treinar outros modelos de IA.

Fonte da imagem: cloudflare.com

Os proprietários de sites podem, teoricamente, tentar afastar os rastreadores de páginas usando arquivos robots.txt com diretivas de bot, alterando as configurações do servidor web, verificações de CAPTCHA e bloqueando bots completamente. Na realidade, os operadores de rastreadores geralmente ignoram as diretivas robots.txt, ignorando os testes CAPTCHA e as configurações do servidor. Como resultado, o volume de tráfego indesejado em recursos aumenta, e os dados do site acabam em matrizes para treinamento de IA sem a permissão dos detentores de direitos autorais – ainda não há uma resposta clara para a questão da legalidade dessa prática.

A Cloudflare propôs não bloquear os rastreadores, mas deixá-los entrar no sistema, apenas para mostrar a eles conteúdo inútil gerado por IA que eles consumiriam assim que entrassem no “labirinto da IA”. Ao detectar a digitalização não autorizada de materiais, o sistema não bloqueia a solicitação, mas emite uma série de links para páginas geradas por IA que são convincentes o suficiente para levar o scanner até elas. Esse conteúdo parece legítimo, mas não é mais o material que o sistema está tentando proteger, o que faz com que o scanner desperdice tempo e recursos. O conteúdo gerado pela IA em si é real e baseado em fatos científicos, porque a Cloudflare não tem intenção de espalhar informações incorretas, e conteúdo totalmente lixo pode prejudicar a reputação de um site e a otimização de mecanismos de busca.

O sistema atuará como um impedimento para rastreadores de conteúdo da web, cujos recursos serão desperdiçados e o custo de operação aumentará. Será uma ferramenta útil para detectar atividade de bots; Uma pessoa não mergulhará em tal “labirinto de IA” a uma profundidade de mais de quatro links, os criadores do sistema têm certeza. Mas isso não é uma panaceia: essas coisas geralmente criam uma corrida armamentista, e a Cloudflare já está pensando no que fazer para se manter à frente.

avalanche

Postagens recentes

A SkyDrive planeja lançar táxis voadores nos céus do Japão em 2028.

O pequeno setor de aviação elétrica atraiu um número significativo de startups, e a japonesa…

26 minutos atrás

O aplicativo oficial do Telegram para Apple Watch foi lançado.

Mais de dez anos após o lançamento da primeira versão do aplicativo Telegram para Apple…

1 hora atrás

O mecanismo de busca Alice, do Yandex, praticamente parou de incluir links para sites que não estejam entre os dez primeiros resultados.

O serviço de resposta neural Alice, do Yandex, direciona, com maior frequência, para sites que…

1 hora atrás

A Rivian iniciou as entregas do crossover elétrico R2, com preços a partir de US$ 58.000.

A startup americana de veículos elétricos Rivian seguiu os passos da Tesla, oferecendo inicialmente modelos…

1 hora atrás

O sonho de voar até estrelas vizinhas em velas solares esbarrou nas duras leis da física.

A ideia mais viável para viajar a outras estrelas continua sendo uma vela solar que,…

1 hora atrás

“Fico feliz pelos meus tataranetos que viverão para ver o lançamento”: Kingdom Hearts 4 retorna do esquecimento com um novo trailer.

O ambicioso RPG de ação Kingdom Hearts 4, da desenvolvedora e publicadora japonesa Square Enix,…

2 horas atrás