Sber ensinou a rede neural de Kandinsky a gerar adesivos e imagens e retratos fotorrealistas

«A Sber apresentou uma nova versão de sua rede neural para geração de imagens a partir de uma descrição de texto – Kandinsky 2.2, que permitirá criar imagens fotorrealistas com maior resolução e alterar a proporção durante a geração, além de proporcionar um aumento significativo na qualidade ao criando retratos.

Geração Kandinsky 2.2. Fonte da imagem: Sberbank

Para treinamento adicional, o Kandinsky 2.2 usou um conjunto de dados de 1,5 bilhão de pares texto-imagem, 300 milhões a mais do que a versão anterior – o Kandinsky 2.1, lançado em abril deste ano e conquistou 2 milhões de usuários em apenas 6 dias.

A nova versão do modelo foi ensinada a criar adesivos, dos quais você pode coletar pacotes de adesivos completos no Telegram. Além disso, graças à introdução de um bloco estrutural especial de alterações controladas ControlNeton, ela ganhou a capacidade de alterar objetos ou elementos individuais em imagens de acordo com uma descrição de texto, mantendo a composição da ilustração original.

Geração Kandinsky 2.2

De acordo com o comunicado de imprensa, o Kandinsky 2.2 entende solicitações em russo e inglês, tem a capacidade de desenhar em mais de 20 estilos, misturar vários desenhos, estilizar uma imagem de acordo com uma descrição de texto, gerar imagens semelhantes às fornecidas e também preencher nas partes que faltam na imagem (inpainting) e crie pinturas no modo de tela infinita (outpainting).

Pacote de adesivos de Kandinsky 2.2

«A rede neural não está mais apenas tentando imitar a criatividade humana, mas é capaz de criar novos significados e interpretações artísticas ”, disse Alexander Vedyakhin, primeiro vice-presidente do conselho do Sberbank, acrescentando que, como a versão anterior, o Kandinsky 2.2 está em o domínio público, e você pode testá-lo totalmente gratuito.

É relatado que você pode conhecer os recursos do Kandinsky 2.2 na página promocional do modelo, na plataforma FusionBrain.AI, no bot Telegram e no bot da rede social VKontakte, bem como usando o “Start Artist ” comando em dispositivos inteligentes Sber, no aplicativo móvel Salut. O modelo está disponível na plataforma ML Space no hub de modelos pré-treinados e conjuntos de dados DataHub.

O desenvolvimento e o treinamento da rede neural foram realizados por pesquisadores da Sber AI com o apoio de cientistas do AIRI Institute of Artificial Intelligence no conjunto de dados combinados da Sber AI e SberDevices.

avalanche

Postagens recentes

O TikTok lançou uma espécie de “Netflix para a Geração Z” — um serviço de microdramas chamado PineDrama.

O TikTok lançou discretamente um novo aplicativo, o PineDrama, para microdramas — vídeos curtos na…

22 minutos atrás

O Google Chrome agora permite que os usuários desativem a IA local para se protegerem contra fraudes.

Os usuários do Google Chrome agora podem desativar o modelo de IA executado localmente que…

2 horas atrás

O maior mito sobre carros elétricos foi desmentido: de acordo com um estudo, as baterias duram mais de 10 anos.

A maioria dos proprietários de carros ainda está considerando a troca de veículos com motor…

4 horas atrás

Das telecomunicações à energia solar: a União Europeia planeja banir tecnologias chinesas de sua infraestrutura crítica.

Autoridades de Bruxelas estão propondo a eliminação gradual de equipamentos fabricados na China da infraestrutura…

5 horas atrás

Uma atualização recente do Windows 11 reduziu o desempenho das placas gráficas Nvidia GeForce.

Este mês, a Microsoft lançou mais uma atualização para o Windows 11, que se mostrou…

8 horas atrás