Cloudflare libera IA em bots que coletam dados para IA

A Cloudflare implantou um sistema de IA projetado para interceptar bots que rastreiam páginas públicas e coletam dados para treinar outros modelos de IA.

Fonte da imagem: cloudflare.com

Os proprietários de sites podem, teoricamente, tentar afastar os rastreadores de páginas usando arquivos robots.txt com diretivas de bot, alterando as configurações do servidor web, verificações de CAPTCHA e bloqueando bots completamente. Na realidade, os operadores de rastreadores geralmente ignoram as diretivas robots.txt, ignorando os testes CAPTCHA e as configurações do servidor. Como resultado, o volume de tráfego indesejado em recursos aumenta, e os dados do site acabam em matrizes para treinamento de IA sem a permissão dos detentores de direitos autorais – ainda não há uma resposta clara para a questão da legalidade dessa prática.

A Cloudflare propôs não bloquear os rastreadores, mas deixá-los entrar no sistema, apenas para mostrar a eles conteúdo inútil gerado por IA que eles consumiriam assim que entrassem no “labirinto da IA”. Ao detectar a digitalização não autorizada de materiais, o sistema não bloqueia a solicitação, mas emite uma série de links para páginas geradas por IA que são convincentes o suficiente para levar o scanner até elas. Esse conteúdo parece legítimo, mas não é mais o material que o sistema está tentando proteger, o que faz com que o scanner desperdice tempo e recursos. O conteúdo gerado pela IA em si é real e baseado em fatos científicos, porque a Cloudflare não tem intenção de espalhar informações incorretas, e conteúdo totalmente lixo pode prejudicar a reputação de um site e a otimização de mecanismos de busca.

O sistema atuará como um impedimento para rastreadores de conteúdo da web, cujos recursos serão desperdiçados e o custo de operação aumentará. Será uma ferramenta útil para detectar atividade de bots; Uma pessoa não mergulhará em tal “labirinto de IA” a uma profundidade de mais de quatro links, os criadores do sistema têm certeza. Mas isso não é uma panaceia: essas coisas geralmente criam uma corrida armamentista, e a Cloudflare já está pensando no que fazer para se manter à frente.

avalanche

Postagens recentes

As ações dos fabricantes de DRAM se estabilizam após o impacto inicial do TurboQuant.

Esta semana, o Google apresentou o TurboQuant, seu método de compressão de dados para IA,…

35 minutos atrás

O lucro anual da BYD caiu pela primeira vez em quatro anos, expondo os horrores da guerra de preços na China.

A empresa chinesa BYD alcançou a liderança no mercado global de veículos elétricos, apesar de…

1 hora atrás

O último dos cofundadores deixou a xAI, restando apenas Elon Musk.

Em termos de migração de talentos, o setor de IA é o mais movimentado do…

2 horas atrás

Os fabricantes chineses de chips pretendem atingir 80% de substituição de importações até 2030.

Para a indústria chinesa de semicondutores, a dependência de tecnologia e equipamentos importados continua sendo…

3 horas atrás

A revista Anthropic atraiu um número recorde de assinantes após o escândalo do Departamento de Defesa dos EUA.

O conflito com o Departamento de Defesa dos EUA e o anúncio humorístico contra o…

4 horas atrás