Na semana passada, a OpenAI apresentou o Sora, um modelo de inteligência artificial treinado para gerar vídeos realistas baseados em descrições de texto. A startup ElevenLabs ofereceu sua própria solução de efeitos sonoros para aplicar efeitos sonoros a tais vídeos.
Fonte da imagem: youtube.com/@elevenlabsio
A ElevenLabs foi fundada em 2022 pelo ex-engenheiro de aprendizado de máquina do Google Piotr Dabkowski e pelo ex-estrategista de implementação da Palantir Mati Staniszewski. A empresa lançou um modelo de conversão de texto em fala e tradução dublada para 20 idiomas, preservando o tom e o timbre originais da voz.
O novo projeto ElevenLabs chama-se Sound Effects – destina-se a criar efeitos sonoros para vídeos sem som; o som é gerado com base na descrição do texto. A empresa demonstrou o trabalho de seu mais recente modelo de IA usando vídeos criados pela rede neural OpenAI Sora. Eles usaram descrições simples como “o som das ondas”, “o som do metal”, “o chilrear dos pássaros” e “o motor de um carro de corrida”.
A ElevenLabs não divulgou detalhes técnicos sobre o funcionamento do sistema de IA, mas os resultados do novo modelo são bastante convincentes – os sons de fundo revelaram-se realistas: ruído da cidade, passos em uma rua movimentada, sinais de um robô humanóide e texto narrado que parece ter sido lido por um ator de Hollywood. A empresa ainda não revelou como planeja proteger seu projeto de tentativas de uso injusto – os efeitos sonoros da ElevenLabs podem ser do interesse de golpistas.
A AMD lançou a versão mais recente do driver gráfico Radeon Software Adrenalin 26.5.2 WHQL.…
O moral na Meta✴ atingiu um nível historicamente baixo às vésperas da demissão de quase…
Antes de seu lançamento iminente, o ambicioso jogo de corrida arcade de mundo aberto Forza…
A AMD atendeu aos pedidos insistentes dos jogadores para fornecer suporte à tecnologia de escalonamento…
A pedido do Eurogamer, Jeff Grattis, chefe da divisão de jogos da Amazon, comentou sobre…
A MSI apresentou a placa de vídeo GeForce RTX 5080 16GB OC em uma edição…