A OpenAI não conseguiu lançar sua prometida ferramenta Media Manager até 2025, que permitiria aos criadores de conteúdo controlar o uso de seu trabalho no treinamento de redes neurais. O Media Manager, anunciado em maio passado, deveria identificar textos, imagens, áudio e vídeos protegidos por direitos autorais.
A ferramenta deveria ajudar a OpenAI a evitar problemas legais associados à violação de propriedade intelectual e, em geral, poderia se tornar um padrão para toda a indústria de inteligência artificial. No entanto, como escreve o TechCrunch, o desenvolvimento do Media Manager não foi inicialmente considerado uma prioridade pela empresa. Um ex-funcionário da OpenAI observou: “Não acho que fosse uma prioridade. Para ser sincero, não me lembro de ninguém trabalhando nisso.” Outra fonte próxima à empresa confirmou que houve discussões sobre a ferramenta, mas não houve novas informações relacionadas ao projeto desde o final de 2024.
Deve-se dizer que recentemente o uso de conteúdo proprietário para treinamento de IA tornou-se repetidamente motivo de controvérsia. Modelos OpenAI como ChatGPT e Sora são treinados em enormes conjuntos de dados, incluindo textos, imagens e vídeos da Internet. Isto permite que os modelos de IA criem novos trabalhos, mas muitas vezes acabam por ser demasiado semelhantes ao original. Por exemplo, Sora pode gerar vídeos com o logotipo do TikTok ou personagens de videogame, e o ChatGPT foi pego usando citações literais de artigos do The New York Times.
Esta prática provoca uma onda de indignação por parte dos autores cujas obras foram utilizadas sem o seu consentimento. Ações coletivas já foram movidas contra a OpenAI por artistas, escritores e grandes empresas de mídia, incluindo The New York Times e Radio-Canada. Autores como a atriz e roteirista americana Sarah Silverman e o escritor Ta-Nehisi Coates também aderiram aos processos, acusando a OpenAI de usar ilegalmente seu trabalho.
A OpenAI propôs soluções alternativas para o problema e atualmente oferece diversas maneiras para os criadores de conteúdo excluirem seu trabalho do treinamento em redes neurais. Especificamente, em setembro de 2024, foi lançado um formulário para solicitar a remoção de imagens de futuros conjuntos de dados. A empresa também não tem nada contra os webmasters que bloqueiam a coleta de dados de seus sites por seus bots, por exemplo, no arquivo “robots.txt”. No entanto, estes métodos têm sido criticados tanto pela sua complexidade (remoção de conteúdo de um conjunto de dados) como pelas suas imperfeições.
O Media Manager, por outro lado, foi apresentado como uma solução multifuncional há muito esperada. Em maio de 2024, a OpenAI disse que estava trabalhando com reguladores na ferramenta e usando tecnologias avançadas de aprendizado de máquina para reconhecer direitos autorais. No entanto, desde o anúncio, a empresa nunca mais mencionou publicamente esta ferramenta. E mesmo que o Media Manager seja lançado, os especialistas duvidam que a ferramenta seja capaz de resolver todos os problemas.
Adrian Cyhan, advogado de propriedade intelectual, observa que mesmo grandes plataformas como YouTube e TikTok têm dificuldade em gerenciar a identificação de conteúdo em grande escala. “Garantir que os criadores de conteúdo e os países cumpram todos os requisitos é uma tarefa extremamente difícil”, disse ele. E o fundador da organização sem fins lucrativos Fairly Trained, Ed Newton-Rex, geralmente acredita que o Media Manager apenas transferirá a responsabilidade para os próprios criadores.
Ao mesmo tempo, mesmo que o Media Manager seja lançado, é improvável que seja capaz de isentar a OpenAI de responsabilidade legal, dizem os especialistas. Evan Everist, especialista em direitos autorais, lembrou que os proprietários de direitos autorais não são obrigados por lei a avisar que seu trabalho não pode ser usado, e “os princípios básicos da lei de direitos autorais permanecem os mesmos: você não pode usar o material de outra pessoa sem permissão”.
Na ausência do Media Manager, a OpenAI implementou até agora filtros que impedem a cópia literal dos dados de outras pessoas, e em ações judiciais a empresa continua a argumentar que os seus modelos de IA criam uma “compilação” em vez de plágio, citando o princípio do “uso justo .” Os tribunais podem apoiar a posição da OpenAI, como aconteceu no caso Google Books, onde o tribunal decidiu que a cópia de milhões de livros pelo Google para o Google Books, uma espécie de arquivo digital, era permitida. No entanto, se os tribunais decidirem que a OpenAI está a utilizar ilegalmente conteúdo protegido por direitos de autor, a empresa terá de repensar a sua estratégia, incluindo o lançamento do Media Manager.
Antecipando o anúncio em grande escala das placas de vídeo de nova geração da AMD…
A marca de jogos Zowie da BenQ revelou o monitor de jogos XL2586X+ de 24,1…
Um estudo realizado por cientistas da Universidade de Washington sugere que os átomos do nosso…
Como parte da CES 2025, que acontecerá em Las Vegas de 7 a 10 de…
Para os veículos elétricos da Tesla, 2024 foi o primeiro ano de fracasso em muitos…
O CEO do YouTube, Neal Mohan, está confiante de que os fatores-chave no desenvolvimento futuro…