Categorias: Mercado de tecnologia e TI. notíciaNotícias da rede

Cloudflare acusa perplexidade na coleta massiva de dados de IA para contornar quaisquer proibições

A Cloudflare acusou a startup Perplexity de extrair dados em massa de sites que proíbem explicitamente a coleta de dados. De acordo com uma pesquisa da Cloudflare publicada em 4 de agosto, os bots da Perplexity ignoraram as restrições técnicas definidas no arquivo robots.txt e continuaram a extrair e copiar conteúdo de dezenas de milhares de domínios, gerando milhões de solicitações diariamente.

Fonte da imagem: Stefan Stefancík/Unsplash

De acordo com a Cloudflare, a Perplexity estava alterando o campo User-Agent de seus bots e usando diferentes sistemas autônomos (ASNs) para evitar bloqueios, inclusive imitando o Google Chrome no macOS. Segundo o TechCrunch, a Cloudflare descobriu essa atividade após clientes reclamarem que já haviam implementado regras robots.txt e bloqueios adicionais para bots Perplexity conhecidos. Como resultado, a Cloudflare usou uma combinação de aprendizado de máquina e sinais de rede para remover os bots Perplexity de sua lista oficial de rastreadores confiáveis e implementar mecanismos adicionais para bloqueá-los.

O porta-voz da Perplexity, Jesse Dwyer, classificou a publicação da Cloudflare como uma ação de marketing, afirmando que as capturas de tela fornecidas não comprovavam o acesso ao conteúdo. Em um e-mail de acompanhamento, ele acrescentou que o bot mencionado na reportagem não pertencia à empresa. No entanto, a Cloudflare insiste que seus dados são precisos.

A Cloudflare já criticou a coleta agressiva de dados por empresas de IA, com o CEO da Cloudflare, Matthew Prince, argumentando repetidamente que a coleta em massa de dados está minando a economia da internet, especialmente para os veículos de notícias. Em resposta, a empresa lançou uma ferramenta gratuita de proteção contra cópia de conteúdo para treinar modelos. Também na esteira disso, a Cloudflare, conforme prometido em setembro de 2024, lançou uma plataforma de negociação que permite que proprietários de sites cobrem dos desenvolvedores de IA pelo acesso aos dados.

Esta não é a primeira vez que a Perplexity é acusada de plagiar seu trabalho. No ano passado, veículos como a Wired acusaram a startup de reproduzir seu material sem a devida atribuição. E no Disrupt 2024, o CEO da Perplexity, Aravind Srinivas, teve dificuldade para definir plágio quando questionado sobre o assunto por Devin Coldewey, do TechCrunch.

admin

Próximo "Esperamos que você goste de dor": desenvolvedores de Baldur's Gate 3 falam sobre conquistas incomuns de jogadores em dois anos desde o lançamento »

Anterior « "Você só precisa trocar de smartphone": Google zomba da Apple pelo atraso no lançamento da versão com IA da Siri

Deixar comentário

Publicado por

admin

7 meses atrás

Postagens recentes

Jogos

A Capcom adiou novamente o lançamento de seu jogo de ação e ficção científica Pragmata, antecipando-o em uma semana.

A Capcom, editora e desenvolvedora japonesa, revelou uma nova data de lançamento e um trailer…

17 minutos atrás

Servidores, clusters, supercomputadores, computadores industriais e multiprocessadores

Para financiar a construção de um centro de dados, a Oracle demitirá mais alguns milhares de funcionários.

No ano passado, o envolvimento da Oracle na construção da infraestrutura de IA dos Estados…

42 minutos atrás

Consoles de jogos

A Microsoft confirmou o desenvolvimento de um console Xbox chamado “Project Helix” com suporte para jogos de PC.

A chefe da divisão de jogos da Microsoft, Asha Sharma, confirmou o desenvolvimento do console…

4 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

O Pentágono notificou oficialmente a administração da Anthropic de que a empresa havia sido adicionada à lista de fornecedores não confiáveis.

Embora a última sexta-feira tenha terminado para a Anthropic apenas com ameaças de representantes das…

5 horas atrás

Desenvolvimento e fabricação de eletrônicos

A Meta está sendo processada devido ao escândalo dos óculos inteligentes Ray-Ban, que envolveu o vazamento de vídeos íntimos.

A Meta✴ e a fabricante de óculos Luxottica foram citadas como rés em um processo…

8 horas atrás

Processadores

A inteligência artificial impulsionou repentinamente a demanda por CPUs, um aumento que a AMD e a Intel não previram.

Na Conferência de Tecnologia, Mídia e Telecomunicações de 2026 da Morgan Stanley, a AMD e…