Categorias: Notícias da rede

Arquivar a internet está se tornando cada vez mais difícil: o Wayback Machine e o Wikimedia sofrem com a escassez de discos rígidos.

O arquivamento de dados da internet está se tornando cada vez mais difícil devido à escassez de espaço de armazenamento e ao aumento dos preços. Os discos rígidos triplicaram de preço devido à sua popularidade entre as grandes empresas. Isso complica bastante o trabalho de projetos como o Wayback Machine e a Wikimedia.

Fonte da imagem: Patrick Lindenberg / unsplash.com

O Internet Archive, uma organização sem fins lucrativos que visa proporcionar “acesso a todo o conhecimento para todos”, foi uma das organizações afetadas pela crise. A organização gerencia uma capacidade de armazenamento de aproximadamente 210 petabytes, com a Wayback Machine exigindo outros 100 terabytes diariamente. O boom da inteligência artificial transformou este projeto em um “desafio que consome muito tempo e dinheiro”, admitem seus líderes. Discos rígidos com capacidade de 28 a 30 terabytes são ideais para essa tarefa, mas frequentemente estão indisponíveis ou são vendidos a preços exorbitantes. Esses desafios são parcialmente mitigados pelos patrocinadores do projeto e pela comunidade — embora esta última ofereça apenas conselhos.

A Fundação Wikimedia, a organização sem fins lucrativos responsável pela Wikipédia, enfrenta desafios complexos: 65 milhões de artigos na plataforma exigem recursos significativos e, principalmente, uma alocação orçamentária cuidadosamente planejada, e a situação atual apenas agravou esses problemas. A organização enfrentou uma crise na aquisição de memória e discos rígidos, bem como nos prazos de entrega de servidores e na nossa capacidade de fazer pedidos futuros.

Outro problema é a crescente complexidade dos mecanismos de arquivamento de dados. Grandes modelos de linguagem de IA são treinados com quantidades massivas de dados, muitas vezes obtidos ilegalmente. Por causa disso, muitos proprietários de sites estão bloqueando o acesso a ferramentas de coleta de dados, sem conseguir distinguir entre bots de IA e serviços legítimos que coletam essas informações para fins educacionais. Esses bloqueios e o aumento dos custos de armazenamento estão afetando não apenas grandes organizações sem fins lucrativos, mas também entusiastas individuais.são forçados a reduzir a escala de suas atividades ou a suspendê-las completamente, aguardando que a situação se estabilize.

admin

Postagens recentes

A Microsoft lançará um superaplicativo com todos os serviços de IA do Copilot de uma só vez.

A Microsoft ainda não resolveu um problema urgente: seu portfólio inclui muitos assistentes de IA…

28 minutos atrás

Caos no solo e pilhas de metal carbonizado: fotos das ruínas do complexo de lançamento da Blue Origin após a explosão foram divulgadas.

Como noticiado anteriormente, ontem, durante um teste estático do novo foguete New Glenn, da Blue…

43 minutos atrás

O robô Atlas da Boston Dynamics executou um chute de futebol “rabona fantasma” sem que suas pernas se enroscassem.

O robô humanoide Hyundai Atlas dominou as técnicas do futebol tão bem que demonstrou um…

59 minutos atrás

A tripulação da espaçonave Shenzhou 21, que estava isolada, finalmente retornou à Terra a bordo da espaçonave Shenzhou 22.

Os taikonautas que foram lançados ao espaço na espaçonave chinesa Shenzhou 21 retornaram à Terra…

59 minutos atrás

O YouTube apresentou três novos recursos para podcasts, incluindo recomendações de IA e a possibilidade de ouvir em qualquer lugar.

O YouTube lançou novas funcionalidades para sua assinatura Premium de podcasts. A atualização inclui uma…

5 horas atrás

A Microsoft também está dando a entender que o anúncio do processador Nvidia N1X para laptops está iminente.

Rumores sobre o possível lançamento do tão aguardado processador N1X, desenvolvido pela Nvidia em parceria…

5 horas atrás