Vários gigantes da tecnologia, incluindo Apple, Anthropic, Nvidia e Salesforce, treinaram seus modelos de inteligência artificial em vídeos do YouTube sem o consentimento do proprietário da plataforma Google e dos autores dos vídeos, descobriu um relatório investigativo do Proof News.

Fonte da imagem: Gerd Altmann / pixabay.com

O suposto infrator de direitos autorais foi a EleutherAI, uma organização sem fins lucrativos que, segundo seu próprio comunicado, ajuda desenvolvedores a treinar modelos de IA. Seu público-alvo não são gigantes da tecnologia, mas pequenos desenvolvedores e cientistas. A EleutherAI lançou o conjunto de dados Pile, uma parte significativa do qual está disponível e aberta a qualquer pessoa na Internet – tudo que você precisa são os recursos para baixá-lo, armazená-lo e processá-lo.

O conjunto de dados do Pile incluía legendas para 173.536 vídeos do YouTube que foram baixados de mais de 48 mil canais – os arquivos de legenda são, na verdade, transcrições de vídeos, e as regras da plataforma do YouTube proíbem o download de seus materiais sem permissão. No entanto, Apple, Nvidia e Salesforce – empresas com capitalizações de centenas de bilhões e trilhões de dólares – admitiram em seus artigos científicos que usaram Pile para treinar IA. A Apple, em particular, usou o Pile para treinar modelos OpenELM lançados em abril, e já em junho falou sobre novos recursos de IA que aparecerão no iPhone e Mac.

Se houve de facto violação de direitos de autor neste incidente, foi a organização sem fins lucrativos EleutherAI que o fez em primeiro lugar, e os gigantes da tecnologia podem ter sido utilizadores genuínos do conjunto de dados disponível publicamente. Este exemplo mostra mais uma vez que o domínio da formação em IA ainda não está bem estabelecido do ponto de vista jurídico.

avalanche

Postagens recentes

Conforme as cartas forem lançadas, conforme a rede ditar: a AWS está implementando uma arquitetura de rede RNG quase aleatória em seus data centers.

A AWS publicou uma descrição técnica da arquitetura de rede de data center que implementará…

4 horas atrás

O chefe da NASA afirma que os voos do foguete New Glenn não serão retomados antes de 2028, eliminando a Blue Origin da corrida lunar.

Durante um teste estático de ignição em 29 de maio de 2026, o foguete New…

5 horas atrás

Foi anunciado o sucessor espiritual de Zeus: Master of Olympus – o jogo de estratégia de construção de cidades Theos: Cities of Myth, onde história e mito se entrelaçam.

A editora Dotemu (Ninja Gaiden: Ragebound, Marvel Cosmic Invasion) e a Triskell Interactive, desenvolvedora de…

5 horas atrás

Plataforma de referência de IA Qualcomm Dragonwing IQ10 para robótica é apresentada.

Cristiano Amon, CEO da Qualcomm, apresentou a plataforma robótica Dragonwing IQ10 atualizada na Computex 2026.…

6 horas atrás

O RPG infernal baseado em turnos, Entropy, do criador de Dread Delusion, recebeu uma demo e uma data de lançamento no Acesso Antecipado do Steam.

A editora DreadXP e o estúdio britânico Lovely Hellplace (Dread Delusion) anunciaram a data de…

6 horas atrás