Categorias: Notícias da rede

Empresas de IA pagarão à Wikipédia para evitar sua falência devido à extração de dados do 3DNews.

O cofundador da Wikipédia, Jimmy Wales, afirmou que a enciclopédia online está trabalhando com grandes empresas de tecnologia para desenvolver acordos de licenciamento de conteúdo para treinamento de IA, semelhantes ao acordo firmado com o Google, a fim de compensar os custos crescentes associados à extração de dados.

Fonte da imagem: Oberon Copeland @veryinformed.com/unsplash.com

Wales afirmou na cúpula Reuters Next em Nova York que o uso do conteúdo da Wikipédia por empresas de tecnologia para treinar grandes modelos de linguagem está levando a um aumento acentuado nos custos, que são arcados pela organização sem fins lucrativos que opera o site. “Os bots de IA que rastreiam a Wikipédia processam o site inteiro. Portanto, precisamos de mais servidores, mais RAM e mais memória cache, e isso é desproporcionalmente caro”, disse ele.

Wales enfatizou que o conteúdo da Wikipédia permanece gratuito para indivíduos sob sua licença, mas o acesso automatizado para organizações comerciais é uma questão completamente diferente. Ele observou que um acordo sobre esse assunto já foi firmado com a Alphabet, empresa controladora do Google, e que negociações estão em andamento com outras empresas.

Em 2022, a Fundação Wikimedia (a organização sem fins lucrativos que administra a Wikipédia) firmou um acordo com o Google, pelo qual a empresa concordou em pagar pelo acesso ao conteúdo da Wikipédia usado para treinar modelos de IA.

Wales lembrou que a principal fonte de renda da fundação são pequenas doações do público, que não se destinam a financiar o desenvolvimento de produtos comerciais de IA multimilionários. “As pessoas doam dinheiro para apoiar a Wikipédia, não para subsidiar a OpenAI, que nos custa uma fortuna. É injusto”, disse ele.

Jimmy Wales afirmou que, devido a problemas financeiros, a Wikipédia também pode considerar o uso de medidas técnicas, como o controle de acesso a conteúdo baseado em IA da Cloudflare, que permite aos clientesRestringir bots de IA que rastreiam a internet. Dado o compromisso ideológico da Wikipédia com o acesso aberto ao conhecimento, isso poderia criar um dilema, reconheceu o cofundador da enciclopédia.

A Wikipédia já havia disponibilizado um conjunto de dados para treinamento de IA para impedir que bots sobrecarregassem seus servidores com coleta de dados.

admin

Postagens recentes

A Cambricon, da China, triplicará a produção de aceleradores de IA para superar a Nvidia na China (3DNews).

O fundador da Nvidia descreve com precisão a situação atual do mercado de componentes de…

2 horas atrás

OpenAI vai adquirir a startup de IA Neptune para ajudar no treinamento de novos modelos de IA (3DNews)

Buscando ampla atenção e a confiança incondicional dos investidores, a OpenAI não hesita mais em…

2 horas atrás

A Microsoft planeja aumentar as remessas do Xbox em 4,8 milhões de consoles por ano, com produção no Vietnã.

As tensões geopolíticas entre os EUA e a China levaram a um aumento acentuado nos…

2 horas atrás

“Além de tudo que poderíamos ter imaginado”: o aclamado Clair Obscur: Expedition 33 se tornou um dos maiores sucessos do Game Pass em 2025.

O aclamado jogo de RPG de fantasia por turnos Clair Obscur: Expedition 33, do estúdio…

2 horas atrás