«Sber apresentou oficialmente uma versão melhorada de sua rede neural generativa Kandinsky 3.1, que permite criar imagens com base em descrições de texto em russo e inglês. O algoritmo atualizado foi adicionalmente treinado em um conjunto ampliado de imagens, com o qual foi possível melhorar a qualidade das gerações.

Fonte da imagem: sberbank.ru

Uma das principais características da nova versão do algoritmo é aumentar a velocidade de geração de imagens. Segundo a empresa, o tempo de criação de uma imagem foi reduzido em quase 10 vezes, e a resolução das gerações pode ser aumentada para o formato 4K. Além disso, os usuários agora podem ativar o recurso de aprimoramento de consulta de texto usando o modelo de linguagem. Estão disponíveis funções para criar diferentes versões de imagens, misturar imagens e texto, criar pacotes de adesivos, além da possibilidade de fazer alterações locais na imagem sem alterar toda a composição.

Ao mesmo tempo, Sber anunciou o surgimento iminente do algoritmo Kandinsky Video 1.1, projetado para gerar vídeos com base em descrições de texto. Os desenvolvedores conseguiram melhorar significativamente a qualidade da geração aumentando o volume de pares texto-vídeo usados ​​para treinar o conjunto de dados, bem como alterando a arquitetura do modelo. As alterações feitas permitiram dobrar a resolução do vídeo em comparação com as capacidades do algoritmo Kandinsky 1.0. O modelo foi desenvolvido por especialistas da Sber AI em conjunto com cientistas do Instituto AIRI de Inteligência Artificial nos conjuntos de dados combinados da Sber AI e da empresa SberDevices.

avalanche

Postagens recentes

A Lenovo estabeleceu um prazo limite para encomendas aos preços antigos; os preços irão aumentar ainda mais devido à escassez de memória.

A Lenovo notificou oficialmente seus parceiros sobre um aumento forçado de preços em diversas configurações…

1 hora atrás

O mistério dos “bonecos de neve” na periferia do sistema solar foi resolvido após seis anos.

A primeira fotografia de um "boneco de neve" muito além da órbita de Netuno foi…

1 hora atrás

A NASA definiu a próxima data para uma missão tripulada à Lua: 6 de março.

A NASA agendou a primeira missão tripulada à Lua para 6 de março. Ontem, 20…

5 horas atrás

Não apenas Cyberpunk 2077: jogos AAA para PC agora rodam em dispositivos Android potentes, mas com limitações.

A emulação de jogos de PC no Android está ganhando força e agora está acessível…

7 horas atrás

Não apenas Cyberpunk 2077: jogos AAA para PC agora rodam em dispositivos Android potentes, mas com limitações.

A emulação de jogos de PC no Android está ganhando força e agora está acessível…

7 horas atrás

A G42, sediada nos Emirados Árabes Unidos, e a Cerebras construirão um supercomputador nacional de IA na Índia com aceleradores WSE-3.

A G42 Holdings, uma holding sediada nos Emirados Árabes Unidos, e a Cerebras, em parceria…

9 horas atrás