A Runway, empresa que desenvolve ferramentas de geração de vídeo baseadas em inteligência artificial, está no centro de um escândalo. A 404 Media publicou uma investigação alegando que a Runway usou milhares de vídeos do YouTube para treinar seu modelo de IA, incluindo conteúdo de empresas de mídia conhecidas e blogueiros populares, sem permissão.
De acordo com o The Verge, a 404 Media obteve acesso a uma planilha contendo dados supostamente usados pela Runway para treinar sua IA. Ele contém links para canais do YouTube de empresas como Netflix, Disney, Nintendo e Rockstar Games, bem como blogueiros populares como MKBHD, Linus Tech Tips e Sam Kolder. Além disso, a tabela continha links para publicações de notícias, incluindo The Verge, The New Yorker, Reuters e Wired.
Segundo um ex-funcionário da Runway, essa tabela consiste em uma lista de canais que “são resultado de um esforço de toda a empresa para encontrar vídeos de qualidade para construir o modelo”. Esses links foram então usados como entrada para um rastreador da web, que baixou o conteúdo usando servidores proxy para evitar ser bloqueado pelo Google.
Além dos canais do YouTube, foram encontrados dados contendo links para sites piratas que exibem filmes licenciados gratuitamente. Ainda não está claro se a Runway usou esses filmes para treinar seu modelo Gen-3 Alpha, mas como explica o The Verge, provavelmente será impossível saber. A publicação pediu à Runway que comentasse a situação, mas ainda não obteve resposta.
É importante notar que a Runway não é a única empresa que usa o YouTube para treinar modelos de IA. No início deste ano, Mira Murati, CTO da OpenAI, disse que não tinha certeza se o modelo de IA para gerar vídeos Full HD de Sora foi treinado no conteúdo do YouTube. Além disso, uma investigação conjunta recente da Proof News e da Wired descobriu que a Anthropic, a Apple, a Nvidia e a Salesforce treinaram seus modelos de IA em mais de 170.000 vídeos do YouTube.