Reddit irá reprimir os criadores de conteúdo de treinamento de IA

A administração da plataforma Reddit anunciou que atualizará as exceções para robôs (arquivo robots.txt), que informam aos web bots se eles estão autorizados ou proibidos de rastrear o site e suas seções. O recurso também tomará medidas para realmente restringir o acesso a alguns bots.

Fonte da imagem: redditinc.com

Tradicionalmente, o arquivo robots.txt era usado para ajudar os mecanismos de pesquisa a rastrear um site corretamente. Mas com o desenvolvimento de sistemas de inteligência artificial, surgiram bots que bombeiam todo o conteúdo do site para treinar modelos sem indicar a origem desse conteúdo. Portanto, juntamente com a atualização do arquivo robots.txt, a administração do Reddit continuará limitando a velocidade de bots desconhecidos e bloqueando seu acesso à plataforma – medidas serão tomadas caso esses sistemas não cumpram a “Política de Conteúdo Público” no site. site.

O novo modo de operação não deve afetar a maioria dos usuários e participantes genuínos do recurso, incluindo pesquisadores e organizações sem fins lucrativos como o Internet Archive, disse a administração do Reddit. As medidas são introduzidas apenas para evitar que outras empresas treinem grandes modelos de linguagem de IA no conteúdo da plataforma. A administração de recursos emitiu um comunicado depois que se soube que a startup de IA Perplexity estava coletando conteúdo contrário às diretivas do robots.txt – o CEO da empresa, Aravind Srinivas, disse que essas diretivas não são uma obrigação legal.

As próximas mudanças do Reddit não afetarão os parceiros que firmaram acordos com a plataforma: Google e OpenAI treinam seus modelos de IA no conteúdo do recurso mediante o pagamento de uma taxa. No ano passado, o Reddit introduziu taxas de acesso à API para proteger contra a coleta não autorizada de conteúdo, o que causou protestos em massa entre os usuários.

avalanche

Postagens recentes

A Marvell adquire a Polariton, desenvolvedora de soluções plasmônicas.

A Marvell Technology anunciou a aquisição da Polariton Technologies, desenvolvedora de dispositivos fotônicos de alta…

31 minutos atrás

Tim Cook revelou seu primeiro grande erro como CEO da Apple.

O CEO da Apple, Tim Cook, classificou o lançamento fracassado do Apple Maps em 2012…

46 minutos atrás

A BioWare está muito ocupada para mostrar o novo Mass Effect.

Michael Gamble, produtor executivo e diretor de desenvolvimento do novo Mass Effect da BioWare, comentou…

1 hora atrás

“O Jogo do Ano Está Chegando”: O trailer de lançamento do jogo de ação e ficção científica Saros foi recebido com entusiasmo pelos jogadores.

O estúdio finlandês Housemarque (Returnal, Nex Machina), em colaboração com a Sony Interactive Entertainment, lançou…

1 hora atrás

O diretor de Escape from Tarkov explicou como Fragmentary Order difere de Arc Raiders, um jogo de tiro de fuga para “jogadores casuais”.

Nikita Buyanov, chefe da Battlestate Games e diretor de desenvolvimento de Escape from Tarkov, compartilhou…

2 horas atrás

Um agente de IA projetou um processador RISC-V completo em 12 horas — o comando solicitado continha apenas 219 palavras.

A Verkor.io, uma startup especializada em design de chips com inteligência artificial, descreveu em um…

2 horas atrás