«Sber anunciou a disponibilização para todos os usuários sem restrições do modelo aprimorado da rede neural generativa Kandinsky 3.1, apresentado no início deste mês. O serviço AI permite criar imagens com base em descrições de texto em russo e inglês. É relatado que a versão atualizada foi treinada adicionalmente em um conjunto de dados de imagens estéticas, o que melhorou a qualidade da geração de imagens.
Além disso, graças a uma nova abordagem de treinamento e ao uso de um conjunto de dados de alta qualidade, a função Inpainting para edição de fragmentos individuais de imagens foi significativamente melhorada.
Segundo Sber, os usuários também têm a oportunidade de usar o rápido modelo Kandinsky 3.1 Flash no bot do Telegram. O tempo de geração de imagens com sua ajuda diminuiu mais de 10 vezes em relação à versão básica.
Segundo o desenvolvedor, serão disponibilizadas ferramentas para criação de imagens no formato 4K, funções para criação de variações de imagens, mixagem de múltiplos arquivos gráficos, mixagem de imagens e textos, geração de pacotes de adesivos, além da possibilidade de fazer edições locais de imagens sem alterar toda a composição da cena ( ControlNet) será adicionado em um futuro próximo. Além disso, em breve todos os usuários poderão testar uma versão atualizada do modelo de geração de vídeo Kandinsky Video 1.1 baseado em texto.