OpenAI processada por uso ilegal de obras literárias para treinar redes neurais

A OpenAI está sendo processada novamente por usar obras para treinar IA. Dois escritores proeminentes entraram com um processo de violação de direitos autorais contra a empresa por trás do ChatGPT e do Bing Chat. Segundo eles, a OpenAI usou seus trabalhos como dados de treinamento. Este parece ser o primeiro processo movido sobre o uso de texto (em oposição a imagens ou código) como dados de treinamento.

Em uma ação movida no Tribunal Distrital do Distrito Norte da Califórnia, os autores Paul Tremblay e Mona Awad alegam que a OpenAI e suas subsidiárias infringiram direitos autorais, violaram a Lei de Direitos Autorais do Milênio Digital (DMCA) e violaram as restrições estatutárias da Califórnia e gerais sobre concorrência desleal .

Os escritores são representados pelo escritório de advocacia de Joseph Saveri e Matthew Butterick, a mesma equipe por trás dos recentes processos movidos contra Stable Diffusion AI e GitHub. A denúncia alega que o romance de Tremblay, The Cabin at the End of the World, e os dois romances Awad: 13 Ways to Look at a Fat Girl e The Bunny foram usados ​​como dados de treinamento para GPT-3.5 e GPT-4. Embora a OpenAI não tenha divulgado que esses romances estão em seus dados de treinamento (que são mantidos em segredo), os demandantes concluem que devem estar lá, pois o ChatGPT foi capaz de fornecer resumos detalhados da trama e responder a perguntas sobre os livros, o que exigiria acesso aos seus Texto:% s.

«Uma vez que os modelos de linguagem OpenAI não podem funcionar sem as informações expressivas extraídas e armazenadas nas obras dos reclamantes (e outros), os próprios modelos de linguagem OpenAI estão infringindo trabalhos derivados criados sem a permissão dos reclamantes e em violação de seus direitos exclusivos sob a Lei de Direitos Autorais, certo”, diz a denúncia.

Todos os três livros contêm informações de direitos autorais (CMI), como ISBNs e números de registro de direitos autorais. O Digital Millennium Copyright Act (DMCA) argumenta que excluir ou adulterar o CMI é ilegal e, como as respostas do ChatGPT não contêm essas informações, os autores alegam que a OpenAI é culpada de violar essa lei, além do fato de violação de direitos autorais .

Embora atualmente haja apenas dois autores no processo, os advogados pretendem classificar o processo, o que permitiria que outros autores cujas obras de autoria tenham sido utilizadas pela OpenAI também recebam indenização. Os advogados estão buscando indenizações monetárias, honorários advocatícios e uma liminar forçando a OpenAI a mudar seu software e práticas comerciais de direitos autorais. O site do escritório de advocacia LLM Litigation detalha a posição dos demandantes e os motivos para entrar com uma ação judicial. “Entramos com uma ação coletiva contra a OpenAI acusando o ChatGPT e seus grandes modelos de linguagem subjacentes, GPT-3.5 e GPT-4, de retrabalhar as obras protegidas por direitos autorais de milhares de escritores – e muitos mais – sem consentimento, compensação ou reconhecimento.” advogados.

Eles também criticam o conceito de IA generativa, afirmando: “IA generativa é apenas inteligência humana reembalada e vendida como um novo produto. Este não é um novo tipo de inteligência. É apenas uma nova maneira de usar a inteligência de outra pessoa sem permissão ou compensação.” Eles observam que, embora a OpenAI diga que não sabe quais livros foram usados ​​para treinar a IA, isso não importa porque: “A OpenAI sabe que usou muitos livros e sabe que não obteve permissão de seus autores. .” “.

Esta não é a primeira vez que a OpenAI enfrenta acusações semelhantes. No entanto, o novo processo será o primeiro a envolver o uso de dados de texto e poderá abrir um precedente para futuros processos de violação de direitos autorais de IA.

avalanche

Postagens recentes

Discos rígidos de 60 TB estarão disponíveis em quatro anos graças à introdução do HAMR

De acordo com a American Engineering Association IEEE, até 2028, o volume de unidades de…

3 horas atrás

O Ministério do Desenvolvimento Digital publicou regras para registrar dez mil blogueiros no registro Roskomnadzor

O Ministério do Desenvolvimento Digital da Federação Russa e Roskomnadzor prepararam regras para verificar os…

5 horas atrás

Elecom anunciou cabos USB4 2.0 – velocidades de até 80 Gbps e até 240 W de potência

O USB Implementers Forum (USB-IF), uma organização sem fins lucrativos que apoia o desenvolvimento e…

5 horas atrás

Arctic confirmou a compatibilidade de seus sistemas de refrigeração com processadores Arrow Lake-S

A Arctic foi um dos primeiros fabricantes de sistemas de refrigeração a mencionar o soquete…

5 horas atrás

Insider confiável: Assassin’s Creed IV: Black Flag remake será lançado mais cedo do que o esperado

Quando os rumores de um remake de Assassin's Creed IV: Black Flag começaram a surgir…

6 horas atrás

Rivian caminha para o pôr do sol: a empresa lançará menos veículos elétricos em 2024 do que em 2023

Rivian anunciou que lançará menos veículos elétricos este ano do que em 2023. A empresa…

6 horas atrás