A Nvidia revelou um novo modelo experimental de IA generativa que a empresa descreve como um “canivete suíço para áudio”. O modelo Fugatto (Fundational Generative Audio Transformer Opus 1) usa prompts de texto para gerar arquivos novos ou modificar arquivos de música, voz e áudio existentes. Desenvolvedores de todo o mundo participaram da criação do modelo, o que fortaleceu as “capacidades multi-sotaques e multilíngues do modelo”.

Fonte da imagem: NVIDIA

«Queríamos criar um modelo que entendesse e gerasse som da mesma forma que os humanos”, disse o participante do projeto e gerente de pesquisa aplicada de áudio da Nvidia Rafael Valle. A empresa propôs vários cenários em que o modelo Fugatto pode ser procurado:

  • Os produtores musicais podem criar rapidamente um protótipo de música que pode ser facilmente editado experimentando diferentes estilos, vozes e instrumentos.
  • O Fugatto pode ser usado para criar ferramentas de aprendizagem de idiomas com a escolha da voz mais adequada.
  • Os desenvolvedores de videogames podem usá-lo para criar variações de recursos pré-gravados para corresponder às mudanças no jogo com base nas escolhas e ações do jogador.

Os pesquisadores afirmam que o modelo, com alguns ajustes adicionais, também pode realizar tarefas que não faziam parte do seu treinamento anterior. O modelo pode combinar instruções separadas, por exemplo, gerando uma fala com certa entonação e sotaque, ou o som de pássaros cantando durante uma tempestade. O modelo também pode gerar sons que mudam com o tempo, como o som de uma tempestade que se aproxima ou de um trem em movimento.

Fugatto não é a primeira tecnologia generativa de IA que pode criar sons a partir de prompts de texto. Meta✴ lançou anteriormente um modelo semelhante de IA de código aberto. O Google oferece sua própria ferramenta de conversão de texto em música de IA, MusicLM, que pode ser acessada através do site AI Test Kitchen da empresa.

A Nvidia ainda não disponibilizou acesso público ao Fugatto e se absteve de comentar o assunto.

avalanche

Postagens recentes

Fim de uma era: a Xiaomi descontinuou a MIUI, a interface que tornou a empresa famosa.

A Xiaomi encerrou oficialmente o suporte para a MIUI, que já foi uma das interfaces…

37 minutos atrás

A Apple lançou o iOS 26.4 e o iPadOS 26.4 com novos emojis e recursos.

As versões estáveis ​​do iOS 26.4 e do iPadOS 26.4 foram lançadas, seis semanas após…

50 minutos atrás

As vendas de Marathon atingiram 1,2 milhão de cópias em três semanas, mas a Sony esperava mais.

Os desenvolvedores do estúdio americano Bungie (pertencente à Sony) estão relutantes em divulgar os números…

1 hora atrás

Meta mentiu sobre a segurança do Facebook, Instagram e WhatsApp para crianças; tribunal a multou em US$ 375 milhões.

Um júri do Novo México considerou a Meta culpada de violar a lei estadual em…

2 horas atrás

A escassez de processadores para PC está se agravando, com preços em alta e prazos de entrega já estendidos por meses.

Os preços da memória começaram a subir para os consumidores no segundo semestre do ano…

2 horas atrás

Foi anunciado o Arbiter 131, um jogo de estratégia tática não linear onde “tudo é decidido através da jogabilidade”.

Os desenvolvedores da Ikon Studios, por meio do portal IGN, apresentaram Arbiter 131 – um…

3 horas atrás