Uma ação coletiva emendada, apresentada no Tribunal Distrital dos Estados Unidos para o Distrito Norte da Califórnia, alega que funcionários da Nvidia acessaram materiais do Anna’s Archive, um site pirata que hospeda milhões de livros e artigos acadêmicos, violando a lei de direitos autorais.

Fonte da imagem: BoliviaInteligente / unsplash.com
O objeto das negociações era o “acesso de alta velocidade” aos dados do arquivo. Representantes do Arquivo de Anna alegadamente afirmaram explicitamente que os materiais haviam sido obtidos ilegalmente e perguntaram se a Nvidia tinha permissão da gerência para continuar trabalhando com eles. Tal permissão foi concedida em breve, segundo o processo.
O Arquivo de Anna ofereceu à Nvidia acesso a aproximadamente 500 terabytes de dados — a coleção contém vários milhões de livros, alguns dos quais estão disponíveis na plataforma Internet Archive por meio de empréstimo digital. Os autores do processo não especificam se a Nvidia pagou pelo acesso às informações ou se utilizou dados pirateados.
Os autores da ação, contudo, acusam a Nvidia de usar outras fontes pirateadas: o conjunto de dados Books3, bem como os sites Library Genesis, Sci-Hub e Z-Library. Outro processo alega que a Nvidia forneceu ferramentas que permitiam aos clientes baixar dados do The Pile, que incluía o Books3 — aproximadamente 200.000 livros. Isso resultou em violação indireta e contingente de direitos autorais, já que os clientes conseguiam acessar livros pirateados usando as ferramentas fornecidas pela empresa. A Nvidia argumentou anteriormente que o treinamento de IA se enquadra no uso justo, pois os modelos de IA aprendem padrões em vez de armazenar textos de livros. O caso está em andamento.