Os escritores processaram a OpenAI e a Microsoft por usarem seus livros para treinar o chatbot inteligente ChatGPT. O processo alega que a Microsoft está “profundamente envolvida” no processo de treinamento do ChatGPT e, portanto, é a única responsável por quaisquer violações junto com o OpenAI.

ChatGPT e IAs semelhantes, que são baseadas em grandes modelos de linguagem (Large Language Model, LLM), “treinam” em grandes quantidades de dados. Ao mesmo tempo, a OpenAI baixa muitas de suas informações da Internet e alguns dados vêm de fontes como não-ficção. Portanto, os autores desses livros agora buscam indenização em uma nova ação judicial.

Segundo a Reuters, o autor Julian Sancton afirma que a OpenAI copiou dezenas de milhares de livros de não ficção sem permissão para ensinar ChatGPT. O autor lidera uma equipe que entrou com uma ação na última terça-feira no tribunal federal de Manhattan. No processo, os demandantes observam que “os modelos dos réus foram calibrados (treinados) através da reprodução de uma vasta gama de materiais protegidos por direitos autorais, incluindo dezenas ou mesmo centenas de milhares de livros de não ficção”.

O processo chega em um momento muito oportuno para a OpenAI, já que a empresa enfrenta uma série de outras questões jurídicas e internas. Outras ações já foram movidas contra a empresa relacionadas a dados privados e uso de conteúdo protegido por direitos autorais. Além disso, a OpenAI enfrentou uma crise de governança no fim de semana, quando seu conselho de administração demitiu o CEO Sam Altman, mas a empresa voltou atrás nessa decisão, prometendo recrutar um novo conselho sob pressão dos funcionários.

A nova ação difere das declarações anteriores porque, junto com a OpenAI, é a primeira vez que a gigante da tecnologia Microsoft, que também é uma grande investidora na OpenAI, aparece nela. O chatbot de IA do Microsoft Bing, a pesquisa baseada em IA e o novo recurso Copilot dependem fortemente da tecnologia OpenAI. Falando figurativamente, é quase como o ChatGPT, mas com sabor Microsoft.

Embora a OpenAI e a Microsoft não tenham comentado este último processo, a OpenAI afirmou anteriormente que o conteúdo gerado pelo ChatGPT não é uma “obra derivada” e, portanto, não infringe os direitos autorais de ninguém.

Durante o corrente ano, houve uma explosão virtual no desenvolvimento do LLM, e muitas questões que afetam o tema dos direitos autorais ainda não foram resolvidas nos tribunais. É provável que as ações judiciais não levem a nada ou obriguem a uma mudança no procedimento de pagamento aos autores do conteúdo utilizado no treinamento LLM. No entanto, ainda é um tanto prematuro falar sobre isso.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *