Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

“Nosso conteúdo é gratuito, mas nossa infraestrutura não”: robôs de IA estão arruinando a Wikipédia

«A Wikipédia paga o preço pelo boom da IA - a enciclopédia online enfrenta custos crescentes com bots que copiam seus artigos para treinar modelos de IA, desperdiçando recursos e aumentando drasticamente o tráfego e a carga no site. Somente nos últimos três meses, o tráfego gerado pelos rastreadores de IA cresceu 50%.

Fonte da imagem: “Wikipédia”

A Wikimedia Foundation (a organização sem fins lucrativos que administra a Wikipédia) disse que “as consultas automatizadas para nosso conteúdo cresceram exponencialmente”. Segundo a fundação, desde janeiro de 2024, a largura de banda usada para baixar conteúdo multimídia aumentou em 50%. No entanto, o tráfego não vem de humanos, mas de programas automatizados que constantemente baixam imagens com licença aberta para alimentar modelos de IA.

«Nossa infraestrutura foi projetada para suportar picos repentinos de tráfego humano durante eventos de alto interesse, mas o volume de tráfego gerado por robôs scraper não tem precedentes e apresenta riscos e custos crescentes”, disse a Wikipedia.

Os bots geralmente coletam dados de artigos menos populares da Wikipédia. Especialistas da Wikipédia afirmam que pelo menos 65% desse tráfego vem de bots, o que é desproporcionalmente grande, já que os bots são responsáveis por cerca de 35% do total de visualizações de páginas. Os bots também demonstram interesse em “sistemas-chave em nossa infraestrutura de desenvolvimento, como nossa plataforma de revisão de código ou nosso rastreador de bugs”, o que sobrecarrega ainda mais os recursos do site.

«A Wikipédia foi forçada a impor limites de velocidade individuais aos bots de IA ou proibir completamente o acesso a alguns deles. Mas para resolver o problema a longo prazo, a fundação está desenvolvendo um plano de “Uso Responsável da Infraestrutura”. O plano inclui coletar feedback da comunidade da Wikipédia sobre maneiras de identificar tráfego de bots de IA e filtrar seu acesso.

A plataforma de mídia social Reddit enfrentou um problema semelhante em 2023. Por exemplo, a Microsoft usou os dados da plataforma para treinar modelos de IA sem notificar o Reddit, o que forçou o Reddit a banir os bots da Microsoft. Após esse incidente, o Reddit decidiu cobrar de desenvolvedores terceirizados pelo acesso à sua API. Isso levou a protestos massivos de desenvolvedores e ao fechamento de alguns fóruns populares do Reddit.

avalanche

Próximo Nintendo aumentará os preços dos jogos antes da Take-Two com GTA VI — Mario Kart World para Switch 2 custará US$ 80 digitalmente e US$ 90 no varejo »

Anterior « AMD encontrou o culpado pelos problemas de inicialização dos sistemas no Ryzen 7 9800X3D

Deixar comentário

Publicado por

avalanche

12 meses atrás

Postagens recentes

Notícias da rede

Jackpot: A segunda temporada de Fallout se tornou um dos maiores sucessos da Amazon.

O Hollywood Reporter, citando a Amazon MGM Studios, compartilhou informações sobre o sucesso da segunda…

29 minutos atrás

Desenvolvimento e fabricação de eletrônicos

A Samsung pretende dominar a tecnologia de processo de 1 nanômetro e introduzir folhas em formato de garfo em transistores até 2030.

A escassez de capacidade da TSMC está abrindo novas oportunidades para a rival Samsung Electronics…

46 minutos atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A Microsoft forçou IAs a testarem umas às outras em pesquisa do Copilot.

A Microsoft introduziu a capacidade de usar vários modelos de IA em um único fluxo…

46 minutos atrás

Redes sociais

A Meta começou a testar uma assinatura do Instagram Plus com Stories expandidos e mais recursos.

A Meta começou a testar uma assinatura paga para recursos adicionais do Instagram em alguns…

58 minutos atrás

Jogos

CEO da Naughty Dog dá aos fãs novas esperanças para The Last of Us Part III

O presidente e diretor criativo da Naughty Dog, Neil Druckmann, usou as redes sociais para…

1 hora atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

O Google lançou um novo sistema de verificação de desenvolvedores.

O Google anunciou um novo sistema de verificação para desenvolvedores de aplicativos Android. Isso será…

2 horas atrás