«A Sber apresentou uma nova versão de sua rede neural para geração de imagens a partir de uma descrição de texto – Kandinsky 2.2, que permitirá criar imagens fotorrealistas com maior resolução e alterar a proporção durante a geração, além de proporcionar um aumento significativo na qualidade ao criando retratos.
Geração Kandinsky 2.2. Fonte da imagem: Sberbank
Para treinamento adicional, o Kandinsky 2.2 usou um conjunto de dados de 1,5 bilhão de pares texto-imagem, 300 milhões a mais do que a versão anterior – o Kandinsky 2.1, lançado em abril deste ano e conquistou 2 milhões de usuários em apenas 6 dias.
A nova versão do modelo foi ensinada a criar adesivos, dos quais você pode coletar pacotes de adesivos completos no Telegram. Além disso, graças à introdução de um bloco estrutural especial de alterações controladas ControlNeton, ela ganhou a capacidade de alterar objetos ou elementos individuais em imagens de acordo com uma descrição de texto, mantendo a composição da ilustração original.
Geração Kandinsky 2.2
De acordo com o comunicado de imprensa, o Kandinsky 2.2 entende solicitações em russo e inglês, tem a capacidade de desenhar em mais de 20 estilos, misturar vários desenhos, estilizar uma imagem de acordo com uma descrição de texto, gerar imagens semelhantes às fornecidas e também preencher nas partes que faltam na imagem (inpainting) e crie pinturas no modo de tela infinita (outpainting).
Pacote de adesivos de Kandinsky 2.2
«A rede neural não está mais apenas tentando imitar a criatividade humana, mas é capaz de criar novos significados e interpretações artísticas ”, disse Alexander Vedyakhin, primeiro vice-presidente do conselho do Sberbank, acrescentando que, como a versão anterior, o Kandinsky 2.2 está em o domínio público, e você pode testá-lo totalmente gratuito.
É relatado que você pode conhecer os recursos do Kandinsky 2.2 na página promocional do modelo, na plataforma FusionBrain.AI, no bot Telegram e no bot da rede social VKontakte, bem como usando o “Start Artist ” comando em dispositivos inteligentes Sber, no aplicativo móvel Salut. O modelo está disponível na plataforma ML Space no hub de modelos pré-treinados e conjuntos de dados DataHub.
O desenvolvimento e o treinamento da rede neural foram realizados por pesquisadores da Sber AI com o apoio de cientistas do AIRI Institute of Artificial Intelligence no conjunto de dados combinados da Sber AI e SberDevices.
A ideia de que a música tem apenas sete notas está perdendo importância na era…
Um levantamento realizado em fevereiro pelo portal alemão 3DCenter mostrou que os preços da memória…
Um levantamento realizado em fevereiro pelo portal alemão 3DCenter mostrou que os preços da memória…
Segundo as estatísticas da RationalFX, janeiro foi bastante produtivo para a indústria global de tecnologia…
Segundo as estatísticas da RationalFX, janeiro foi bastante produtivo para a indústria global de tecnologia…
O Departamento de Defesa dos EUA publicou e removeu quase imediatamente uma versão atualizada de…