A Nvidia negou as alegações de que treinou modelos de IA com base em livros pirateados. Os advogados da empresa argumentaram em um tribunal federal da Califórnia que os supostos contatos da Nvidia com a biblioteca do site de pirataria Anna’s Archive não constituem prova de violação de direitos autorais.

Fonte da imagem: Future
Em sua petição para arquivamento do processo, protocolada em 29 de janeiro, a empresa argumenta que os autores de Nazemian v. Nvidia não conseguiram provar de forma convincente que suas obras específicas foram baixadas ou usadas para treinar os modelos de IA da Nvidia, apesar de terem ampliado a queixa dos autores para incluir novas premissas e conjuntos de dados.
O caso foi aberto no início de 2024 e julgado no Distrito Norte da Califórnia. Ele diz respeito a alegações de que as ferramentas de IA e os modelos de referência da Nvidia foram treinados com livros protegidos por direitos autorais obtidos de chamadas “bibliotecas paralelas”, incluindo o Anna’s Archive e o Books3. A queixa emendada dos autores cita discussões internas nas quais funcionários da Nvidia supostamente buscaram confirmação de acesso ao Anna’s Archive. Os autores alegam que isso constitui prova de uso ilegal.
Em sua petição para arquivamento do processo, a Nvidia argumenta que a queixa emendada carece até mesmo dos elementos mais básicos necessários para estabelecer uma alegação de violação de direitos autorais. Segundo a empresa, os demandantes “não alegam fatos que comprovem que a Nvidia copiou quaisquer de suas obras protegidas por direitos autorais, quando essa cópia ocorreu ou quais modelos da Nvidia supostamente contêm essas obras”. A empresa argumenta que, sem esses detalhes, as alegações são puramente especulativas.
Abordando especificamente as alegações relacionadas ao repositório de livros pirateados Anna’s Archive, a Nvidia afirma que, embora o demandante descreva discussões internas e solicitações de possível acesso ao site, não alega fatos que comprovem que a cópia ocorreu, nem que houve qualquer tipo de violação dos direitos autorais.A petição argumenta que a Nvidia não obteve ou baixou nenhuma das obras dos autores. A petição também alega que discutir ou avaliar possíveis fontes de dados não configura cópia de material protegido por direitos autorais e que a lei de direitos autorais exige que os autores apresentem fatos que comprovem a reprodução de obras protegidas por direitos autorais. “É igualmente provável que a Nvidia não tenha acessado as obras dos autores”, afirma a petição.
A Nvidia, sem rodeios, também critica os autores por se basearem em declarações feitas “com base em conversas e crenças”. A empresa alega que, ao fazer isso, os autores estão tentando usar indevidamente o processo de descoberta de provas como base para sua ação. Em sua petição, a Nvidia lembra ao tribunal que os autores de ações por violação de direitos autorais devem alegar a violação antes do início do processo de descoberta de provas, em vez de depender dele para determinar se a violação ocorreu, que é o que os autores parecem estar tentando fazer neste caso.
A Nvidia também busca restringir o escopo do caso, contestando a inclusão de informações sobre conjuntos de dados e modelos adicionais, como o Megatron 345M, adicionados à petição inicial emendada. A empresa argumenta que os autores da ação estão agrupando indevidamente múltiplos modelos e ferramentas em um único caso, sem explicar como cada modelo foi treinado com base em seu trabalho. Em diversos momentos, a Nvidia cita sua própria documentação pública para comprovar que as suposições dos autores sobre os dados de treinamento são contraditas por fontes públicas.
A petição inicial emendada também apresenta uma teoria de inferência secundária.A Nvidia entrou com uma ação judicial contra a plataforma NeMo Megatron e seu suporte para download de grandes conjuntos de dados públicos, como o The Pile. A Nvidia responde que a ação não alega violação direta de direitos autorais por terceiros, o que é necessário para fundamentar alegações de violação indireta ou contributiva de direitos autorais. A empresa argumenta que o fornecimento de ferramentas opcionais não estabelece responsabilidade na ausência de alegações específicas de que os usuários infringiram direitos autorais ao usar essas ferramentas.
Uma audiência sobre a moção de indeferimento está marcada para 2 de abril de 2026, no Tribunal Distrital dos Estados Unidos para o Distrito Norte da Califórnia.