Cloudflare libera IA em bots que coletam dados para IA

A Cloudflare implantou um sistema de IA projetado para interceptar bots que rastreiam páginas públicas e coletam dados para treinar outros modelos de IA.

Fonte da imagem: cloudflare.com

Os proprietários de sites podem, teoricamente, tentar afastar os rastreadores de páginas usando arquivos robots.txt com diretivas de bot, alterando as configurações do servidor web, verificações de CAPTCHA e bloqueando bots completamente. Na realidade, os operadores de rastreadores geralmente ignoram as diretivas robots.txt, ignorando os testes CAPTCHA e as configurações do servidor. Como resultado, o volume de tráfego indesejado em recursos aumenta, e os dados do site acabam em matrizes para treinamento de IA sem a permissão dos detentores de direitos autorais – ainda não há uma resposta clara para a questão da legalidade dessa prática.

A Cloudflare propôs não bloquear os rastreadores, mas deixá-los entrar no sistema, apenas para mostrar a eles conteúdo inútil gerado por IA que eles consumiriam assim que entrassem no “labirinto da IA”. Ao detectar a digitalização não autorizada de materiais, o sistema não bloqueia a solicitação, mas emite uma série de links para páginas geradas por IA que são convincentes o suficiente para levar o scanner até elas. Esse conteúdo parece legítimo, mas não é mais o material que o sistema está tentando proteger, o que faz com que o scanner desperdice tempo e recursos. O conteúdo gerado pela IA em si é real e baseado em fatos científicos, porque a Cloudflare não tem intenção de espalhar informações incorretas, e conteúdo totalmente lixo pode prejudicar a reputação de um site e a otimização de mecanismos de busca.

O sistema atuará como um impedimento para rastreadores de conteúdo da web, cujos recursos serão desperdiçados e o custo de operação aumentará. Será uma ferramenta útil para detectar atividade de bots; Uma pessoa não mergulhará em tal “labirinto de IA” a uma profundidade de mais de quatro links, os criadores do sistema têm certeza. Mas isso não é uma panaceia: essas coisas geralmente criam uma corrida armamentista, e a Cloudflare já está pensando no que fazer para se manter à frente.

avalanche

Postagens recentes

A Microsoft corrigiu três vulnerabilidades zero-day perigosas e outras 200 falhas em seu software.

A Microsoft lançou sua atualização de junho na terça-feira de atualizações, corrigindo 200 vulnerabilidades, incluindo…

1 hora atrás

Inteligência artificial ajuda a atualizar drivers AMD Radeon que têm quase 20 anos.

Segundo o Phoronix, a versão mais recente do driver gráfico Gallium3D R600, incluída no Mesa…

3 horas atrás

A NASA apresentou a tripulação da missão lunar Artemis 3, mas ela não chegará à Lua.

A NASA anunciou os nomes dos astronautas que irão ao espaço na missão Artemis 3…

3 horas atrás

A Anthropic revelou Claude Fable 5, uma “versão segura” do tão comentado Mythos.

No início deste mês, a Anthropic expandiu a disponibilidade de seu modelo de IA mais…

4 horas atrás