«Sber ensinou seu chatbot AI GigaCgat a gerar composições musicais com base em solicitações de texto do usuário. A notícia foi compartilhada por Denis Filippov, vice-presidente de superfícies digitais “Salyut” do Sberbank, na conferência internacional sobre inteligência artificial AI Jorney 2023. As capacidades do serviço foram ampliadas com a integração das redes neurais CLaMP e SymFormer.

Para criar música, uma pessoa pode simplesmente formular uma tarefa. Por exemplo, defina a seguinte descrição: “Componha música country divertida” ou “Escreva uma composição para a área lounge de um business center”. Como resultado, o GigaChat criará um arquivo de áudio com uma faixa musical exclusiva, bem como uma partitura em formato MIDI, compatível com qualquer DAW (Digital Audio Workstation). Depois disso, o usuário poderá baixar e ouvir a música resultante, além de utilizar o arquivo MIDI em seus projetos criativos: editar harmonias, alterar o arranjo e obter diversas opções de som para a composição.

A geração de música é possível no GigaChat graças à integração das redes neurais CLaMP e SymFormer. Para o j,extybz SymFormer, utilizamos a plataforma ML Space baseada no supercomputador Christofari e um conjunto de dados de mais de 200 mil composições de diferentes estilos musicais: da música clássica à moderna eletrônica e pesada. O modelo de geração de composição baseia-se no princípio de considerar a música como um texto musical – isto foi ajudado pela adaptação da abordagem texto-2-imagem ao domínio musical.

Observa-se que a criação das faixas musicais ocorre em diversas etapas:

  • Usando o modelo CLaMP, a solicitação de texto do usuário é convertida em uma linguagem compreensível para o gerador de melodia.
  • Os dados do CLaMP, incluindo informações de estilo, são inseridos no SysFormer, que gera diversas opções para uma composição multitrilha, a partir da qual a rede neural seleciona as opções de estilo de maior sucesso.
  • Na última etapa da geração, o mecanismo de renderização gera um arquivo de áudio e envia o resultado ao usuário.
  • «Os novos recursos do GigaChat serão úteis não apenas para entusiastas da música e representantes de profissões criativas. Vemos os representantes das pequenas e médias empresas como um dos segmentos do público-alvo do serviço. Graças ao GigaChat, eles poderão resolver problemas de negócios de forma rápida, eficiente e, o mais importante, de forma absolutamente legal: criar música de fundo para cafés, salas de espera e salões de beleza, criar melodias para vídeos publicitários e redes sociais”, explica Denis Filippov.

    Recordemos que no início deste outono, no âmbito do programa cultural do Fórum Económico Oriental (EEF), teve lugar em Vladivostok o primeiro concerto sinfónico do mundo com improvisações criadas pela inteligência artificial. A rede neural SymFormer se apresentou neste concerto junto com a orquestra do Teatro Mariinsky do Palco Primorsky. No primeiro movimento da sinfonia Cosmos, escrita pelo compositor Petr Dranga, SymFormer controlou a expressividade da execução. No terceiro e quarto movimentos da sinfonia, a rede neural improvisou em tempo real com base nas informações recebidas da partitura do músico.

    avalanche

    Postagens recentes

    Os cientistas tornaram as baterias de metal de lítio mais ecológicas sem comprometer o desempenho

    Pesquisadores da ETH Zurique descobriram uma maneira de reduzir radicalmente os efeitos nocivos do flúor,…

    17 segundos atrás

    Apple finalmente aprova aplicativo Epic Games para iOS na Europa

    A Apple concordou em hospedar a loja de aplicativos Epic Games em dispositivos iPhone e…

    2 horas atrás

    Samsung lançou um SSD de 61,44 TB e anunciou um modelo de 122,88 TB

    A Samsung apresentou discretamente um dos SSDs de maior capacidade do mundo, o BM1743 de…

    2 horas atrás

    O maior banco de dados de senhas com 10 bilhões de entradas únicas foi publicado online.

    Pesquisadores da Cybernews descobriram a maior coleção de senhas, composta por 9.948.575.739 combinações únicas armazenadas…

    2 horas atrás