Sber apresentou o artista AI Kandinsky 3.0 – ele se tornou mais preciso e estudou o código cultural doméstico

«Sber apresentou na conferência AI Journey um modelo atualizado de inteligência artificial generativa Kandinsky 3.0, projetado para criar imagens. Ela aprendeu a entender melhor as consultas de texto dos usuários e começou a gerar imagens, pinturas artísticas e esboços mais fotorrealistas.

Fonte da imagem: sberbank.com

Uma das inovações mais importantes de Kandinsky 3.0 foi o treinamento da rede neural com elementos do código cultural doméstico – isso afetou celebridades e personagens soviéticos e russos, marcos arquitetônicos, objetos culturais e objetos de arte popular: em particular, a rede neural está familiarizado com Gzhel. O desenvolvedor melhorou a função de edição de imagens e a capacidade de completar a pintura no modo tela infinita.

Por padrão, Kandinsky 3.0 gera imagens com resolução de 1024 × 1024 pixels, mas você pode escolher uma proporção diferente. Durante o treinamento, o desenvolvedor utilizou uma matriz de 1,5 bilhão de pares de imagens com descrições de texto. A rede neural também recebeu suporte para geração de vídeos de 4 segundos baseados em descrições de texto – eles têm resolução de 640 × 640 pixels com frequência de 24 quadros por segundo. A geração de um segundo de vídeo leva aproximadamente 20 segundos. Os modelos de animação incluem objetos em movimento, aproximando-os, afastando-os e outras técnicas. O algoritmo é baseado em redesenhar uma imagem com base em uma descrição de texto.

Você pode trabalhar com o modelo Kandinsky 3.0 na plataforma fusionbrain.ai, no site rudalle.ru, usando bots no Telegram e VKontakte, em correspondência com o chat bot GigaChat, nos aplicativos SberBank Online e Salyut, bem como em smart dispositivos do Sber ao comando “lançar o artista”. O acesso à criação de animações no Telegram está sujeito a candidatura prévia.

avalanche

Postagens recentes

A Marvell adquire a Polariton, desenvolvedora de soluções plasmônicas.

A Marvell Technology anunciou a aquisição da Polariton Technologies, desenvolvedora de dispositivos fotônicos de alta…

36 minutos atrás

Tim Cook revelou seu primeiro grande erro como CEO da Apple.

O CEO da Apple, Tim Cook, classificou o lançamento fracassado do Apple Maps em 2012…

51 minutos atrás

A BioWare está muito ocupada para mostrar o novo Mass Effect.

Michael Gamble, produtor executivo e diretor de desenvolvimento do novo Mass Effect da BioWare, comentou…

1 hora atrás

“O Jogo do Ano Está Chegando”: O trailer de lançamento do jogo de ação e ficção científica Saros foi recebido com entusiasmo pelos jogadores.

O estúdio finlandês Housemarque (Returnal, Nex Machina), em colaboração com a Sony Interactive Entertainment, lançou…

1 hora atrás

O diretor de Escape from Tarkov explicou como Fragmentary Order difere de Arc Raiders, um jogo de tiro de fuga para “jogadores casuais”.

Nikita Buyanov, chefe da Battlestate Games e diretor de desenvolvimento de Escape from Tarkov, compartilhou…

2 horas atrás

Um agente de IA projetou um processador RISC-V completo em 12 horas — o comando solicitado continha apenas 219 palavras.

A Verkor.io, uma startup especializada em design de chips com inteligência artificial, descreveu em um…

2 horas atrás