«Sber ensinou seu chatbot AI GigaCgat a gerar composições musicais com base em solicitações de texto do usuário. A notícia foi compartilhada por Denis Filippov, vice-presidente de superfícies digitais “Salyut” do Sberbank, na conferência internacional sobre inteligência artificial AI Jorney 2023. As capacidades do serviço foram ampliadas com a integração das redes neurais CLaMP e SymFormer.

Para criar música, uma pessoa pode simplesmente formular uma tarefa. Por exemplo, defina a seguinte descrição: “Componha música country divertida” ou “Escreva uma composição para a área lounge de um business center”. Como resultado, o GigaChat criará um arquivo de áudio com uma faixa musical exclusiva, bem como uma partitura em formato MIDI, compatível com qualquer DAW (Digital Audio Workstation). Depois disso, o usuário poderá baixar e ouvir a música resultante, além de utilizar o arquivo MIDI em seus projetos criativos: editar harmonias, alterar o arranjo e obter diversas opções de som para a composição.

A geração de música é possível no GigaChat graças à integração das redes neurais CLaMP e SymFormer. Para o j,extybz SymFormer, utilizamos a plataforma ML Space baseada no supercomputador Christofari e um conjunto de dados de mais de 200 mil composições de diferentes estilos musicais: da música clássica à moderna eletrônica e pesada. O modelo de geração de composição baseia-se no princípio de considerar a música como um texto musical – isto foi ajudado pela adaptação da abordagem texto-2-imagem ao domínio musical.

Observa-se que a criação das faixas musicais ocorre em diversas etapas:

  • Usando o modelo CLaMP, a solicitação de texto do usuário é convertida em uma linguagem compreensível para o gerador de melodia.
  • Os dados do CLaMP, incluindo informações de estilo, são inseridos no SysFormer, que gera diversas opções para uma composição multitrilha, a partir da qual a rede neural seleciona as opções de estilo de maior sucesso.
  • Na última etapa da geração, o mecanismo de renderização gera um arquivo de áudio e envia o resultado ao usuário.
  • «Os novos recursos do GigaChat serão úteis não apenas para entusiastas da música e representantes de profissões criativas. Vemos os representantes das pequenas e médias empresas como um dos segmentos do público-alvo do serviço. Graças ao GigaChat, eles poderão resolver problemas de negócios de forma rápida, eficiente e, o mais importante, de forma absolutamente legal: criar música de fundo para cafés, salas de espera e salões de beleza, criar melodias para vídeos publicitários e redes sociais”, explica Denis Filippov.

    Recordemos que no início deste outono, no âmbito do programa cultural do Fórum Económico Oriental (EEF), teve lugar em Vladivostok o primeiro concerto sinfónico do mundo com improvisações criadas pela inteligência artificial. A rede neural SymFormer se apresentou neste concerto junto com a orquestra do Teatro Mariinsky do Palco Primorsky. No primeiro movimento da sinfonia Cosmos, escrita pelo compositor Petr Dranga, SymFormer controlou a expressividade da execução. No terceiro e quarto movimentos da sinfonia, a rede neural improvisou em tempo real com base nas informações recebidas da partitura do músico.

    avalanche

    Postagens recentes

    “Eu nem imaginava que isso fosse possível”: modder assume a tarefa de portar The Elder Scrolls III: Morrowind para Elden Ring

    Enquanto alguns fãs estão recriando The Elder Scrolls III: Morrowind no motor Skyrim, outros estão…

    6 horas atrás

    Kojima revelará segredo sobre jogos futuros em homenagem ao 10º aniversário da Kojima Productions

    O estúdio japonês Kojima Productions, fundado no final de 2015 pelo renomado designer de jogos…

    7 horas atrás

    Calendário de Lançamentos – 1 a 7 de setembro: Hollow Knight: Silksong, Cronos: The New Dawn e Metal Eden

    Análise do modo ranqueado de Warface: fácil de pegar o jeito, difícil de largar

    9 horas atrás

    CD Projekt Red intriga fãs de Cyberpunk 2077 com teaser misterioso do presidente dos EUA

    Embora o suporte de conteúdo para o RPG de ação cyberpunk em primeira pessoa Cyberpunk…

    9 horas atrás

    A seleção de horas e minutos do despertador do iPhone não é um ciclo, mas uma longa lista com um final inesperado

    Parece difícil imaginar algo mais elementar do ponto de vista do usuário do que escolher…

    9 horas atrás