«Sber apresentou oficialmente uma versão melhorada de sua rede neural generativa Kandinsky 3.1, que permite criar imagens com base em descrições de texto em russo e inglês. O algoritmo atualizado foi adicionalmente treinado em um conjunto ampliado de imagens, com o qual foi possível melhorar a qualidade das gerações.

Fonte da imagem: sberbank.ru

Uma das principais características da nova versão do algoritmo é aumentar a velocidade de geração de imagens. Segundo a empresa, o tempo de criação de uma imagem foi reduzido em quase 10 vezes, e a resolução das gerações pode ser aumentada para o formato 4K. Além disso, os usuários agora podem ativar o recurso de aprimoramento de consulta de texto usando o modelo de linguagem. Estão disponíveis funções para criar diferentes versões de imagens, misturar imagens e texto, criar pacotes de adesivos, além da possibilidade de fazer alterações locais na imagem sem alterar toda a composição.

Ao mesmo tempo, Sber anunciou o surgimento iminente do algoritmo Kandinsky Video 1.1, projetado para gerar vídeos com base em descrições de texto. Os desenvolvedores conseguiram melhorar significativamente a qualidade da geração aumentando o volume de pares texto-vídeo usados ​​para treinar o conjunto de dados, bem como alterando a arquitetura do modelo. As alterações feitas permitiram dobrar a resolução do vídeo em comparação com as capacidades do algoritmo Kandinsky 1.0. O modelo foi desenvolvido por especialistas da Sber AI em conjunto com cientistas do Instituto AIRI de Inteligência Artificial nos conjuntos de dados combinados da Sber AI e da empresa SberDevices.

avalanche

Postagens recentes

A Nvidia demonstrou a tecnologia RTX Mega Geometry em The Witcher 4 — em uma RTX 5090, a demonstração técnica alcançou 80 fps em 4K com DLSS.

A Nvidia divulgou a gravação completa de sua apresentação na GDC 2026, mostrando a tecnologia…

37 minutos atrás

A OpenAI decidiu repentinamente gastar mais de cem milhões de dólares para comprar um programa de entrevistas popular.

Ao que tudo indicava, o abandono de áreas de desenvolvimento secundárias, incluindo o fim do…

3 horas atrás

A IBM está criando laços entre mainframes e arquiteturas Arm, mas parece não entender completamente o porquê.

A IBM anunciou uma colaboração estratégica com a Arm para "desenvolver um novo hardware de…

9 horas atrás

O Caminho Óctuplo para a IAG: Do Falso Nirvana ao Verdadeiro Nirvana / Inteligência Artificial

Qualquer pessoa não budista que tenha ao menos vagamente ouvido falar desse antigo ensinamento sabe…

11 horas atrás