O CEO da Meta✴, Mark Zuckerberg, autorizou pessoalmente a divisão Meta✴ responsável pelo desenvolvimento de modelos de inteligência artificial Llama a usar um conjunto de dados contendo livros e artigos obtidos ilegalmente para treiná-los. Isso ficou conhecido a partir de documentos publicados como parte do processo do escritor Richard Kadrey contra Meta✴.
O caso é apenas um entre vários casos em que gigantes da tecnologia que desenvolvem sistemas de IA são acusados de treinar modelos em material protegido por direitos autorais sem a permissão dos autores. Os réus têm tradicionalmente argumentado que as suas ações atendem ao padrão de uso justo, uma doutrina que permite que os direitos autorais sejam anulados para criar novas obras e produtos que sejam substancialmente diferentes do original. Muitos detentores de direitos autorais não concordam com esta posição.
Um novo lote de documentos desclassificados (PDF) fornece depoimentos de representantes da Meta✴: descobriu-se que Mark Zuckerberg aprovou pessoalmente o uso da matriz LibGen pela empresa para treinar Llama. O projeto LibGen, que se autodenomina um agregador de links, na verdade fornece acesso a obras protegidas por direitos autorais operadas por grandes editoras. Ele foi processado repetidamente, dezenas de milhões de dólares foram recuperados dele por violações de direitos autorais e, como resultado, o projeto foi forçado a encerrar. Zuckerberg, dizem os documentos, aprovou o uso do LibGen para treinar pelo menos um modelo Llama, apesar das preocupações levantadas pelos funcionários e pela administração da Meta✴. É citado um memorando interno que observa que o trabalho da LibGen foi aprovado após “escalada para MZ”, uma sigla que aparentemente significava o chefe da empresa.
A parte demandante apresentou uma declaração ao tribunal em 8 de janeiro contendo novas acusações. Em particular, alega-se que Meta✴ poderia tentar ocultar este ato e remover informações sobre o uso de materiais LibGen – isso foi supostamente feito pelo engenheiro Meta✴ Nikolay Bashlykov, que escreveu um script que removeu informações de direitos autorais de livros na matriz de treinamento . Meta✴ também supostamente removeu avisos de direitos autorais e metadados relacionados de artigos de revistas científicas do conjunto de dados. Além disso, Meta✴ violou direitos autorais ao baixar o array LibGen através do protocolo BitTorrent – neste momento a empresa não apenas baixou, mas também “distribuiu” simultaneamente esses dados, na verdade distribuindo materiais piratas, afirma o autor. O chefe de IA generativa da Meta✴, Ahmad Al-Dahle, deu permissão para baixar dados da LibGen via BitTorrent, embora o engenheiro Bashlykov tenha indicado que isso “pode não ser legalmente permitido”.
O caso ainda está longe de terminar. Por enquanto, isso se aplica apenas aos primeiros modelos do Llama, não aos lançamentos mais recentes. E se a Meta✴ convencer o tribunal do uso justo dos materiais, ela poderá ficar do lado da empresa – em 2023, vários demandantes não conseguiram provar a violação de direitos autorais e suas reivindicações contra a Meta✴ foram rejeitadas.
Fonte da imagem: Ubisoft Como notaram os usuários das redes sociais, 20 de março de…
Na próxima semana, a NASA, no âmbito da missão Blue Ghost 1, poderá enviar à…
Em setembro, a Xiaomi apresentou a linha de smartphones Redmi Note 14 na China, que…
Em Junho passado, a Nokia anunciou a venda planeada da ASN, anunciando simultaneamente a compra…
Embora a Palit já tenha anunciado suas versões das placas de vídeo GeForce RTX 5090,…
A Xiaomi lançou o smartphone de preço médio Redmi Note 14 para o mercado internacional.…