Sber ensinou a rede neural de Kandinsky a gerar adesivos e imagens e retratos fotorrealistas

«A Sber apresentou uma nova versão de sua rede neural para geração de imagens a partir de uma descrição de texto – Kandinsky 2.2, que permitirá criar imagens fotorrealistas com maior resolução e alterar a proporção durante a geração, além de proporcionar um aumento significativo na qualidade ao criando retratos.

Geração Kandinsky 2.2. Fonte da imagem: Sberbank

Para treinamento adicional, o Kandinsky 2.2 usou um conjunto de dados de 1,5 bilhão de pares texto-imagem, 300 milhões a mais do que a versão anterior – o Kandinsky 2.1, lançado em abril deste ano e conquistou 2 milhões de usuários em apenas 6 dias.

A nova versão do modelo foi ensinada a criar adesivos, dos quais você pode coletar pacotes de adesivos completos no Telegram. Além disso, graças à introdução de um bloco estrutural especial de alterações controladas ControlNeton, ela ganhou a capacidade de alterar objetos ou elementos individuais em imagens de acordo com uma descrição de texto, mantendo a composição da ilustração original.

Geração Kandinsky 2.2

De acordo com o comunicado de imprensa, o Kandinsky 2.2 entende solicitações em russo e inglês, tem a capacidade de desenhar em mais de 20 estilos, misturar vários desenhos, estilizar uma imagem de acordo com uma descrição de texto, gerar imagens semelhantes às fornecidas e também preencher nas partes que faltam na imagem (inpainting) e crie pinturas no modo de tela infinita (outpainting).

Pacote de adesivos de Kandinsky 2.2

«A rede neural não está mais apenas tentando imitar a criatividade humana, mas é capaz de criar novos significados e interpretações artísticas ”, disse Alexander Vedyakhin, primeiro vice-presidente do conselho do Sberbank, acrescentando que, como a versão anterior, o Kandinsky 2.2 está em o domínio público, e você pode testá-lo totalmente gratuito.

É relatado que você pode conhecer os recursos do Kandinsky 2.2 na página promocional do modelo, na plataforma FusionBrain.AI, no bot Telegram e no bot da rede social VKontakte, bem como usando o “Start Artist ” comando em dispositivos inteligentes Sber, no aplicativo móvel Salut. O modelo está disponível na plataforma ML Space no hub de modelos pré-treinados e conjuntos de dados DataHub.

O desenvolvimento e o treinamento da rede neural foram realizados por pesquisadores da Sber AI com o apoio de cientistas do AIRI Institute of Artificial Intelligence no conjunto de dados combinados da Sber AI e SberDevices.

avalanche

Postagens recentes

Tesla lança raquete de pickleball por US$ 350

A Tesla, fabricante de carros elétricos de Elon Musk, lança regularmente produtos inusitados, sejam eles…

21 minutos atrás

A fabricante de caminhões elétricos Nikola, que entrou em falência, agora conta com apenas um funcionário e um prejuízo de US$ 556 milhões.

Em fevereiro deste ano, a Nikola Motor, que tentava iniciar a produção de caminhões movidos…

1 hora atrás

A CATL planeja iniciar a produção em massa de baterias de íon-sódio para veículos elétricos e outras aplicações em 2026.

Em abril deste ano, a empresa chinesa CATL, líder global na produção de baterias de…

1 hora atrás

A NEC do Japão está interrompendo o desenvolvimento de estações base 4G e 5G, por não conseguir competir com as empresas chinesas e europeias.

A NEC, do Japão, deixará de desenvolver estações base 4G e 5G, mas continuará a…

3 horas atrás

As vendas anuais de chips Wi-Fi 6E e Wi-Fi 7 ultrapassaram os 40 bilhões de dólares.

A Research & Markets estima que o mercado global de chips Wi-Fi 6E e Wi-Fi…

4 horas atrás