Cloudflare libera IA em bots que coletam dados para IA

A Cloudflare implantou um sistema de IA projetado para interceptar bots que rastreiam páginas públicas e coletam dados para treinar outros modelos de IA.

Fonte da imagem: cloudflare.com

Os proprietários de sites podem, teoricamente, tentar afastar os rastreadores de páginas usando arquivos robots.txt com diretivas de bot, alterando as configurações do servidor web, verificações de CAPTCHA e bloqueando bots completamente. Na realidade, os operadores de rastreadores geralmente ignoram as diretivas robots.txt, ignorando os testes CAPTCHA e as configurações do servidor. Como resultado, o volume de tráfego indesejado em recursos aumenta, e os dados do site acabam em matrizes para treinamento de IA sem a permissão dos detentores de direitos autorais – ainda não há uma resposta clara para a questão da legalidade dessa prática.

A Cloudflare propôs não bloquear os rastreadores, mas deixá-los entrar no sistema, apenas para mostrar a eles conteúdo inútil gerado por IA que eles consumiriam assim que entrassem no “labirinto da IA”. Ao detectar a digitalização não autorizada de materiais, o sistema não bloqueia a solicitação, mas emite uma série de links para páginas geradas por IA que são convincentes o suficiente para levar o scanner até elas. Esse conteúdo parece legítimo, mas não é mais o material que o sistema está tentando proteger, o que faz com que o scanner desperdice tempo e recursos. O conteúdo gerado pela IA em si é real e baseado em fatos científicos, porque a Cloudflare não tem intenção de espalhar informações incorretas, e conteúdo totalmente lixo pode prejudicar a reputação de um site e a otimização de mecanismos de busca.

O sistema atuará como um impedimento para rastreadores de conteúdo da web, cujos recursos serão desperdiçados e o custo de operação aumentará. Será uma ferramenta útil para detectar atividade de bots; Uma pessoa não mergulhará em tal “labirinto de IA” a uma profundidade de mais de quatro links, os criadores do sistema têm certeza. Mas isso não é uma panaceia: essas coisas geralmente criam uma corrida armamentista, e a Cloudflare já está pensando no que fazer para se manter à frente.

avalanche

Postagens recentes

O jogo de tiro com temática de evacuação Marathon não terá o sistema de matchmaking para raides de Arc Raiders, que separa jogadores agressivos de jogadores pacíficos.

Antes do lançamento do jogo de tiro de ficção científica com temática de evacuação, Marathon,…

2 horas atrás

A Sony começou a oferecer consoles PlayStation 5 em regime de aluguel mensal.

A PlayStation UK anunciou o lançamento de um programa de aluguel do console PlayStation 5.…

5 horas atrás

A Acer e a Asus suspenderam as vendas de PCs na Alemanha devido a uma disputa de patentes com a Nokia.

A Acer e a Asus suspenderam temporariamente a venda de computadores desktop e laptops na…

5 horas atrás