O acesso beta ao modelo Lyria 3 do laboratório DeepMind do Google permitiu que os usuários do chatbot Gemini criassem composições musicais curtas de 30 segundos com base em descrições de texto, imagens e vídeos, sem sequer sair da interface do chatbot.

Fonte da imagem: Nvidia
Esta semana, usuários do Google em todo o mundo ganharam acesso a esta ferramenta de geração de música. Inicialmente, as consultas e os resultados são suportados em inglês, alemão, espanhol, francês, japonês, coreano, português e hindi. As consultas neste serviço podem se referir a estilos musicais específicos, estados de espírito ou situações típicas da vida. O serviço pode gerar composições instrumentais e vocais com base em letras fornecidas pelo usuário. Para um resultado mais preciso em termos do estado de espírito gerado, os usuários podem anexar fotos ou vídeos às suas consultas de texto.
O Google enfatiza que esta ferramenta não visa criar obras-primas musicais, mas sim entreter e permitir que os usuários se expressem. Para facilitar a distribuição das composições musicais de 30 segundos, o Google fornecerá capas geradas usando o Nano Banana. Essas composições também podem ser usadas com o Dream Track, uma ferramenta que permite acompanhar vídeos curtos publicados no YouTube com músicas de criadores independentes. Com base na experiência anterior com ferramentas de geração de música com inteligência artificial, o Google incluiu mecanismos em seu modelo Lyria 3 para evitar a cópia descarada de obras de autores específicos e das vozes de artistas específicos. O Lyria está disponível desde 2023, mas o acesso a ele era limitado à plataforma de nuvem Google Vertex. A integração dessas funcionalidades ao Google Gemini torna a ferramenta de geração de música mais abrangente.acessível, mas nessa área a empresa está ficando para trás em relação a muitos concorrentes, como o TikTok e a Microsoft.