Os usuários do Google Gemini agora podem criar faixas musicais de 30 segundos com base em descrições e imagens.

O acesso beta ao modelo Lyria 3 do laboratório DeepMind do Google permitiu que os usuários do chatbot Gemini criassem composições musicais curtas de 30 segundos com base em descrições de texto, imagens e vídeos, sem sequer sair da interface do chatbot.

Fonte da imagem: Nvidia

Esta semana, usuários do Google em todo o mundo ganharam acesso a esta ferramenta de geração de música. Inicialmente, as consultas e os resultados são suportados em inglês, alemão, espanhol, francês, japonês, coreano, português e hindi. As consultas neste serviço podem se referir a estilos musicais específicos, estados de espírito ou situações típicas da vida. O serviço pode gerar composições instrumentais e vocais com base em letras fornecidas pelo usuário. Para um resultado mais preciso em termos do estado de espírito gerado, os usuários podem anexar fotos ou vídeos às suas consultas de texto.

O Google enfatiza que esta ferramenta não visa criar obras-primas musicais, mas sim entreter e permitir que os usuários se expressem. Para facilitar a distribuição das composições musicais de 30 segundos, o Google fornecerá capas geradas usando o Nano Banana. Essas composições também podem ser usadas com o Dream Track, uma ferramenta que permite acompanhar vídeos curtos publicados no YouTube com músicas de criadores independentes. Com base na experiência anterior com ferramentas de geração de música com inteligência artificial, o Google incluiu mecanismos em seu modelo Lyria 3 para evitar a cópia descarada de obras de autores específicos e das vozes de artistas específicos. O Lyria está disponível desde 2023, mas o acesso a ele era limitado à plataforma de nuvem Google Vertex. A integração dessas funcionalidades ao Google Gemini torna a ferramenta de geração de música mais abrangente.acessível, mas nessa área a empresa está ficando para trás em relação a muitos concorrentes, como o TikTok e a Microsoft.

admin

Compartilhar
Publicado por
admin

Postagens recentes

O CapCut será integrado ao Gemini, permitindo que os usuários editem vídeos sem nenhuma habilidade específica.

O modelo de IA Gemini do Google está em ascensão. O algoritmo já foi integrado…

32 minutos atrás

O modelo de IA GPT-4.5 foi bem-sucedido no teste de Turing, sendo confundido com um humano em 73% das vezes, mas não é tão simples assim.

Algumas IAs modernas são capazes de passar no teste de Turing — o teste clássico…

32 minutos atrás

Europeus acusaram o Google, a Meta e o TikTok de não combaterem a fraude.

Um grupo de defesa do consumidor da União Europeia apresentou queixas contra o Google, Meta✴…

32 minutos atrás

As empresas de computação quântica viram seus preços subirem acentuadamente após a promessa de apoio do governo dos EUA.

As ações de empresas de computação quântica dispararam no pregão de hoje, após notícias de…

44 minutos atrás