A Adobe apresentou uma ferramenta de áudio com inteligência artificial que permite adicionar rapidamente música de fundo e narração temáticas aos seus vídeos. As ferramentas Gerar Trilha Sonora e Gerar Voz serão integradas à versão atualizada do aplicativo Adobe Firefly.

Fonte da imagem: Adobe
O recurso Gerar Trilha Sonora, já em versão beta pública, analisa um vídeo carregado e gera até quatro faixas de áudio instrumentais com duração de até cinco minutos, sincronizando-as automaticamente com o vídeo. Os usuários podem selecionar um estilo musical a partir de predefinições, como lo-fi, hip-hop, clássico e outros, ou descrever o clima desejado em um campo de texto, como “sentimental” ou “agressivo”. O sistema também sugerirá inicialmente exemplos de consultas de texto com base em uma análise do conteúdo do vídeo.

Em relação aos direitos autorais, o modelo de IA Firefly, que alimenta o Generate Soundtrack, foi treinado com conteúdo musical licenciado, tornando as faixas resultantes seguras para uso comercial, segundo a empresa. Como explica Alexandru Costin, chefe de IA generativa da Adobe, a Adobe adquiriu os direitos da música e das vozes dos detentores dos direitos autorais, garantindo que não haja riscos associados à violação de direitos autorais. Isso diferencia a Adobe de concorrentes como Suno e Udio, que enfrentaram processos por violação de direitos autorais por treinarem seus modelos com materiais protegidos.
Ao mesmo tempo, o Generate Speech, um recurso para criar locuções a partir de texto, foi lançado em versão beta pública. Ele oferece mais de 50 vozes baseadas no modelo de fala Adobe Firefly ou na tecnologia ElevenLabs e suporta mais de 20 idiomas. É possível ajustar a velocidade, a altura e o tom emocional da fala, bem como corrigir manualmente a pronúncia de nomes e palavras regionais específicas.
A Adobe também está desenvolvendo um editor de vídeo Firefly baseado na web, um editor multitrack com uma linha do tempo para gerar, organizar, cortar e editar clipes. A nova ferramenta combinará recursos para criação de locuções, trilhas sonoras e títulos em um único aplicativo, com edição quadro a quadro e predefinições de estilo. O editor começará a ser disponibilizado em versão beta no próximo mês, e os usuários poderão se inscrever em uma lista de espera para acesso antecipado.
