A OpenAI disse que está desenvolvendo uma ferramenta chamada Media Manager que permitirá aos criadores e proprietários de conteúdo marcar seu trabalho para a empresa e indicar se ele pode ou não ser incluído no conjunto de dados para pesquisa e treinamento em IA.
Os engenheiros da OpenAI pretendem desenvolver esta ferramenta até 2025. A empresa está agora trabalhando com “criadores de conteúdo, detentores de direitos e reguladores” para desenvolver um padrão. “A criação de uma ferramenta inédita que nos ajudará a identificar texto, áudio e vídeo protegidos por direitos autorais em diversas fontes e refletir as preferências do criador exigirá pesquisas de ponta em aprendizado de máquina. Planejamos introduzir recursos e funcionalidades adicionais ao longo do tempo”, disse OpenAI em uma postagem no blog.
O Media Manager provavelmente será a resposta da empresa às críticas à sua abordagem ao desenvolvimento da inteligência artificial. Baseia-se fortemente em dados publicamente disponíveis na Internet, mas recentemente a OpenAI foi processada por várias publicações importantes dos EUA por violação de propriedade intelectual, alegando que a empresa roubou o conteúdo dos seus artigos para treinar modelos generativos de IA, que depois comercializou sem compensação ou crédito de publicações originais.
A OpenAI acredita que é impossível criar modelos úteis de IA sem materiais protegidos por direitos autorais. Mas, em um esforço para reprimir as críticas e se defender contra possíveis ações judiciais, a empresa tomou várias medidas para acomodar os criadores de conteúdo. No ano passado, permitiu que artistas removessem seus trabalhos de conjuntos de dados de treinamento para geradores de imagens e também introduziu uma diretiva para o arquivo robots.txt que impede que seu rastreador copie o conteúdo de sites para treinar ainda mais a IA. A OpenAI continua a celebrar acordos com os principais detentores de direitos autorais para usar seus materiais.