Mais de 15,8 milhões de vídeos de mais de 2 milhões de canais do YouTube foram incluídos em um conjunto de dados destinado ao treinamento de inteligência artificial; empresas de tecnologia os estão usando em seus projetos sem permissão, observou a revista americana The Atlantic.
Crédito da imagem: Aidin Geranrekab / unsplash.com
Esses vídeos aparecem em pelo menos 13 conjuntos de dados distribuídos por desenvolvedores de IA de empresas de tecnologia, universidades e organizações de pesquisa por meio de plataformas como a Hugging Face. Na maioria dos casos, os vídeos são anônimos — nem seus títulos nem os nomes dos autores são indicados; embora os jornalistas da publicação tenham conseguido identificá-los.
Para criar geradores de vídeos de IA, os desenvolvedores precisam de um grande número de vídeos, e o YouTube parece ser uma fonte padrão de material para esses fins. A plataforma permite que usuários de planos pagos carreguem vídeos no aplicativo para assisti-los a qualquer hora e em qualquer lugar; os desenvolvedores os baixam como arquivos e os processam com algoritmos de IA, o que viola diretamente os termos de serviço da plataforma, mas sua administração aparentemente não faz nada.
Nem todos os vídeos no YouTube são protegidos por direitos autorais; alguns vídeos são até mesmo carregados por usuários não relacionados aos detentores dos direitos autorais, mas muitos são de fato protegidos. Sua cópia ou distribuição não autorizada é ilegal, e a questão de se eles são de uso justo para treinamento de IA ainda está sendo debatida em processos judiciais. Alguns juízes discordam da posição das empresas de tecnologia, mas ainda não há consenso.
Fonte da imagem: Rubidium Beach / unsplash.com
Vídeos gerados por IA, como vídeos históricos, estão se tornando cada vez mais comuns no YouTube — apesar de muitas imprecisões, eles já começaram a substituir conteúdo verificado por especialistas; o mesmo vale para remixes de músicas. O problema vai muito além do YouTube: muitos chatbots modernos são alimentados por modelos de IA multimodais que podem gerar arquivos de mídia como respostas — em breve, o ChatGPT ou outra plataforma retornará um vídeo instrucional personalizado em vez de um link para um vídeo instrucional do YouTube. Pode ser pior do que um gerado por humanos, mas será adaptado às necessidades do usuário.
Vídeos de treinamento, que incluem vídeos baixados do YouTube, são usados por muitas empresas de tecnologia, incluindo Microsoft, Meta✴, Amazon, Nvidia, Runway, ByteDance, Snap e Tencent. Meta✴, Amazon e Nvidia responderam aos pedidos de comentários dos jornalistas e garantiram que respeitam os criadores de conteúdo e consideram o uso desses dados legal. A Amazon acrescentou que está trabalhando em um sistema que gerará “anúncios atraentes e de alta qualidade com base em consultas simples”.
O Meta✴ possui um serviço chamado Movie Gen que gera vídeos com base em consultas de texto; o Snapchat possui um recurso chamado AI Video Lenses, que permite complementar os vídeos dos usuários com elementos usando IA generativa. Esses serviços não seriam possíveis se as empresas que os possuem não treinassem a IA em um grande volume de vídeos, assim como o ChatGPT não conseguiria escrever no espírito de Shakespeare se não o “lesse”. Grande parte do material é retirado de canais de notícias e educacionais; centenas de milhares de vídeos foram criados por autores de canais comuns.Desenvolvedores de IAadmitem que alguns vídeos são mais interessantes para eles do que outros. Por exemplo, a Runway, uma empresa especializada no desenvolvimento de geradores de vídeo de IA, listou extraoficialmente “movimento rápido de câmera”, “belas paisagens cinematográficas”, “clipes de filme de alta qualidade” e “curtas de ficção científica de altíssima qualidade” como materiais de origem prioritários. Os criadores dos conjuntos de treinamento HowTo100M e HD-VILA-100M dão prioridade a vídeos com alto número de visualizações no YouTube; para o conjunto HD-VG-130M, os vídeos são selecionados por um modelo de IA especialmente treinado. Vídeos com legendas e logotipos de canais recebem menor prioridade — há o risco de que esses elementos também acabem nos vídeos gerados; talvez os proprietários dos canais devam prestar atenção a esse fato se não quiserem ver seu trabalho nos conjuntos de treinamento.
Fonte da imagem: BoliviaInteligente / unsplash.com
Ao preparar um vídeo para adicionar à matriz, os desenvolvedores dividem o material em clipes curtos, descartando, por exemplo, momentos de mudança de ângulo. Uma descrição em inglês é adicionada a cada clipe criado dessa forma para que o modelo aprenda a associar palavras a imagens em movimento e, posteriormente, gere um vídeo com base em uma consulta de texto. Às vezes, essa anotação é feita por pessoas, às vezes por modelos especiais de IA. No canal TED, a IA é usada para dublar a fala dos palestrantes e até mesmo corrigir a articulação labial para sincronizar com a faixa de áudio em um novo idioma.
Serviços para usuários comuns também estão surgindo ativamente. O Facetune permite corrigir rostos em gravações de vídeo; o Facewow permite substituí-los completamente; o Runway Aleph permite alterar as cores de objetos ou transformar o tempo ensolarado em uma tempestade de neve. O Google Gemini transforma fotos em vídeos curtos; a IA do Vidnoz promete gerar imagens realistas de pessoas falando em qualquer estilo; o Arcads produz comerciais completos com atores e dublagens — recursos semelhantes estão disponíveis no Symphony Creative Studio para TikTok. Provas virtuais de roupas, criação de seus próprios jogos de computador, animação de pessoas e personagens de desenhos animados também estão disponíveis.
Sérios conflitos surgem por causa da IA. O júri do festival de publicidade Cannes Lions concedeu, e a administração posteriormente revogou, o prêmio a um vídeo que usava a imagem da política americana DeAndrea Salvador — ela processou tanto a empresa que criou o vídeo quanto seus clientes. Disney e Universal, seguidas pela Warner Brothers, entraram com um processo.os criadores do gerador de imagens Midjourney, que o processo descreveu como um “poço sem fundo de plágio”. O Meta✴ foi processado por dois estúdios de filmes adultos depois que a gigante das mídias sociais baixou e começou a distribuir mais de 2.000 de seus vídeos via BitTorrent. O usuário do YouTube David Millette processou a Nvidia em agosto passado, acusando a empresa de enriquecimento injusto e concorrência desleal no treinamento da IA Cosmos, mas o caso foi encerrado.
As pessoas estão ganhando dinheiro com conteúdo de IA. A DeepBrain AI paga US$ 500 por vídeos de IA publicados no YouTube que obtêm 10.000 visualizações, e isso não é um padrão muito alto. O Google e o Meta✴ compartilham a receita de publicidade com os usuários das plataformas e frequentemente incentivam a criação de conteúdo com IA. Há também “ciganos da informação” prontos para ensinar os segredos de como ganhar dinheiro com materiais criados por IA. Os próprios gigantes da tecnologia treinam seus sistemas de IA em vídeos de suas plataformas: o Google extraiu pelo menos 70 milhões de vídeos do YouTube e o Meta✴ treinou a IA em mais de 65 milhões de vídeos do Instagram✴. Não está longe o dia em que as pessoas terão que competir com a IA para criar conteúdo de maior qualidade. E as redes sociais perderão gradualmente seu caráter originalmente social — ironicamente, o chefe da OpenAI, Sam Altman, refletiu sobre isso recentemente.
O recurso Live Translation dos fones de ouvido sem fio AirPods da Apple não estará…
O canal do YouTube Monitors Unboxed relatou o andamento de testes independentes em um monitor…
Como se sabe, os fabricantes de chips de RAM de "primeira linha" pretendem reduzir a…
A versão de pré-visualização do Windows 11 25H2 foi disponibilizada aos participantes do programa Windows…
Na véspera da compra de frequências para comunicações sem fio na faixa de 50 MHz…
A produção de chips utilizando tecnologias litográficas avançadas exige o uso não apenas de equipamentos…