O cofundador da Wikipédia, Jimmy Wales, afirmou que a enciclopédia online está trabalhando com grandes empresas de tecnologia para desenvolver acordos de licenciamento de conteúdo para treinamento de IA, semelhantes ao acordo firmado com o Google, a fim de compensar os custos crescentes associados à extração de dados.
Fonte da imagem: Oberon Copeland @veryinformed.com/unsplash.com
Wales afirmou na cúpula Reuters Next em Nova York que o uso do conteúdo da Wikipédia por empresas de tecnologia para treinar grandes modelos de linguagem está levando a um aumento acentuado nos custos, que são arcados pela organização sem fins lucrativos que opera o site. “Os bots de IA que rastreiam a Wikipédia processam o site inteiro. Portanto, precisamos de mais servidores, mais RAM e mais memória cache, e isso é desproporcionalmente caro”, disse ele.
Wales enfatizou que o conteúdo da Wikipédia permanece gratuito para indivíduos sob sua licença, mas o acesso automatizado para organizações comerciais é uma questão completamente diferente. Ele observou que um acordo sobre esse assunto já foi firmado com a Alphabet, empresa controladora do Google, e que negociações estão em andamento com outras empresas.
Em 2022, a Fundação Wikimedia (a organização sem fins lucrativos que administra a Wikipédia) firmou um acordo com o Google, pelo qual a empresa concordou em pagar pelo acesso ao conteúdo da Wikipédia usado para treinar modelos de IA.
Wales lembrou que a principal fonte de renda da fundação são pequenas doações do público, que não se destinam a financiar o desenvolvimento de produtos comerciais de IA multimilionários. “As pessoas doam dinheiro para apoiar a Wikipédia, não para subsidiar a OpenAI, que nos custa uma fortuna. É injusto”, disse ele.
Jimmy Wales afirmou que, devido a problemas financeiros, a Wikipédia também pode considerar o uso de medidas técnicas, como o controle de acesso a conteúdo baseado em IA da Cloudflare, que permite aos clientesRestringir bots de IA que rastreiam a internet. Dado o compromisso ideológico da Wikipédia com o acesso aberto ao conhecimento, isso poderia criar um dilema, reconheceu o cofundador da enciclopédia.
A Wikipédia já havia disponibilizado um conjunto de dados para treinamento de IA para impedir que bots sobrecarregassem seus servidores com coleta de dados.
A startup apoiada pelo ex-CEO do Google, Eric Schmidt, desenvolveu um dispositivo inusitado para a…
O fundador da Nvidia descreve com precisão a situação atual do mercado de componentes de…
A escassez global e a forte alta nos preços dos chips de memória estão se…
Buscando ampla atenção e a confiança incondicional dos investidores, a OpenAI não hesita mais em…
As tensões geopolíticas entre os EUA e a China levaram a um aumento acentuado nos…
O aclamado jogo de RPG de fantasia por turnos Clair Obscur: Expedition 33, do estúdio…