O cofundador da Wikipédia, Jimmy Wales, afirmou que a enciclopédia online está trabalhando com grandes empresas de tecnologia para desenvolver acordos de licenciamento de conteúdo para treinamento de IA, semelhantes ao acordo firmado com o Google, a fim de compensar os custos crescentes associados à extração de dados.

Fonte da imagem: Oberon Copeland @veryinformed.com/unsplash.com

Wales afirmou na cúpula Reuters Next em Nova York que o uso do conteúdo da Wikipédia por empresas de tecnologia para treinar grandes modelos de linguagem está levando a um aumento acentuado nos custos, que são arcados pela organização sem fins lucrativos que opera o site. “Os bots de IA que rastreiam a Wikipédia processam o site inteiro. Portanto, precisamos de mais servidores, mais RAM e mais memória cache, e isso é desproporcionalmente caro”, disse ele.

Wales enfatizou que o conteúdo da Wikipédia permanece gratuito para indivíduos sob sua licença, mas o acesso automatizado para organizações comerciais é uma questão completamente diferente. Ele observou que um acordo sobre esse assunto já foi firmado com a Alphabet, empresa controladora do Google, e que negociações estão em andamento com outras empresas.

Em 2022, a Fundação Wikimedia (a organização sem fins lucrativos que administra a Wikipédia) firmou um acordo com o Google, pelo qual a empresa concordou em pagar pelo acesso ao conteúdo da Wikipédia usado para treinar modelos de IA.

Wales lembrou que a principal fonte de renda da fundação são pequenas doações do público, que não se destinam a financiar o desenvolvimento de produtos comerciais de IA multimilionários. “As pessoas doam dinheiro para apoiar a Wikipédia, não para subsidiar a OpenAI, que nos custa uma fortuna. É injusto”, disse ele.

Jimmy Wales afirmou que, devido a problemas financeiros, a Wikipédia também pode considerar o uso de medidas técnicas, como o controle de acesso a conteúdo baseado em IA da Cloudflare, que permite aos clientesRestringir bots de IA que rastreiam a internet. Dado o compromisso ideológico da Wikipédia com o acesso aberto ao conhecimento, isso poderia criar um dilema, reconheceu o cofundador da enciclopédia.

A Wikipédia já havia disponibilizado um conjunto de dados para treinamento de IA para impedir que bots sobrecarregassem seus servidores com coleta de dados.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *