Cloudflare libera IA em bots que coletam dados para IA

A Cloudflare implantou um sistema de IA projetado para interceptar bots que rastreiam páginas públicas e coletam dados para treinar outros modelos de IA.

Fonte da imagem: cloudflare.com

Os proprietários de sites podem, teoricamente, tentar afastar os rastreadores de páginas usando arquivos robots.txt com diretivas de bot, alterando as configurações do servidor web, verificações de CAPTCHA e bloqueando bots completamente. Na realidade, os operadores de rastreadores geralmente ignoram as diretivas robots.txt, ignorando os testes CAPTCHA e as configurações do servidor. Como resultado, o volume de tráfego indesejado em recursos aumenta, e os dados do site acabam em matrizes para treinamento de IA sem a permissão dos detentores de direitos autorais – ainda não há uma resposta clara para a questão da legalidade dessa prática.

A Cloudflare propôs não bloquear os rastreadores, mas deixá-los entrar no sistema, apenas para mostrar a eles conteúdo inútil gerado por IA que eles consumiriam assim que entrassem no “labirinto da IA”. Ao detectar a digitalização não autorizada de materiais, o sistema não bloqueia a solicitação, mas emite uma série de links para páginas geradas por IA que são convincentes o suficiente para levar o scanner até elas. Esse conteúdo parece legítimo, mas não é mais o material que o sistema está tentando proteger, o que faz com que o scanner desperdice tempo e recursos. O conteúdo gerado pela IA em si é real e baseado em fatos científicos, porque a Cloudflare não tem intenção de espalhar informações incorretas, e conteúdo totalmente lixo pode prejudicar a reputação de um site e a otimização de mecanismos de busca.

O sistema atuará como um impedimento para rastreadores de conteúdo da web, cujos recursos serão desperdiçados e o custo de operação aumentará. Será uma ferramenta útil para detectar atividade de bots; Uma pessoa não mergulhará em tal “labirinto de IA” a uma profundidade de mais de quatro links, os criadores do sistema têm certeza. Mas isso não é uma panaceia: essas coisas geralmente criam uma corrida armamentista, e a Cloudflare já está pensando no que fazer para se manter à frente.

avalanche

Postagens recentes

Sistema de IA Aardvark Weather substituirá supercomputadores na previsão do tempo

Cientistas da Universidade de Cambridge revelaram o Aardvark Weather, um sistema de previsão do tempo…

3 horas atrás

Geely não vai abandonar o uso de motores de combustão interna em seus carros

Alguns anos atrás, na esteira do entusiasmo pela eletrificação do transporte, muitas montadoras começaram a…

4 horas atrás

Google testa fechamento de notícias da UE sem perder receita de anúncios

O Google conduziu um experimento em oito países da União Europeia (UE), excluindo temporariamente links…

6 horas atrás

Cientistas tentaram gerar corrente elétrica usando a rotação da Terra

Um grupo de físicos da Universidade de Princeton conduziu um experimento no qual investigou se…

6 horas atrás

O Museu Two Point é uma adição maravilhosa à coleção. Análise

Jogado no Xbox Series S No Two Point Hospital e no Two Point Campus, a…

6 horas atrás