Os engenheiros do Sberbank sugeriram gerar imagens de emoji com base em descrições fornecidas pelo usuário. Para fazer isso, eles usaram a rede neural ruDALL-E (XL), com base na qual construíram o modelo Emojich.
A rede neural ruDALL-E foi desenvolvida por especialistas da Sber AI e SberDevices, seu objetivo é criar imagens baseadas em uma descrição de texto em russo. O projeto Emojich foi construído nesta plataforma. Como Sberbank enfatizou, este é o primeiro exemplo de uma aplicação prática de uma rede neural. Você pode conhecer o trabalho do projeto usando o bot Telegram, o aplicativo Salute, bem como em uma seção especial do site ruDALL-E. Os autores do projeto sugerem que os usuários do aplicativo dêem o comando: “Fireworks, ligue o artista” e, em seguida, formule um pedido de imagem emoji. O código Emojich é publicado no repositório oficial de rede neural no Github.
O vice-presidente executivo da estação de serviço do Sberbank Group, David Rafalovsky, observou que os emojis são usados ativamente hoje em dia na comunicação em mensageiros, mas seu alcance e, portanto, o conjunto de emoções que expressam, é limitado. Portanto, os autores do projeto decidiram treinar a rede neural para gerar novos emoji baseados em qualquer frase.
A rede neural ruDALL-E foi anunciada pelo Sberbank em novembro. Para sua formação, foram utilizados dois tipos de dados: textos e imagens, graças aos quais ela pode criar figuras a partir de descrições de texto. A rede neural existe em duas versões: ruDALL-E XL com 1,3 bilhões de parâmetros e ruDALL-E 12B com 12 bilhões de parâmetros.