Sber apresentou a rede neural Kandinsky Video – ela gera vídeos de 8 segundos com base na descrição do texto

«Sber apresentou a rede neural Kandinsky Video, capaz de criar vídeos curtos a partir de uma descrição de texto. O algoritmo gera sequências de vídeo de até 8 segundos de duração a uma frequência de 30 quadros por segundo. O novo produto foi apresentado na conferência AI Journey pelo primeiro vice-presidente do conselho do Sberbank, Alexander Vedyakhin.

Fonte da imagem: sberbank.com

A arquitetura do Kandinsky Video inclui dois blocos principais. O primeiro bloco é responsável por gerar quadros-chave utilizados para criar a estrutura do enredo do vídeo, e o segundo gera quadros de interpolação, conseguindo assim um movimento suave no vídeo final. Ambos os blocos são construídos com base no modelo de síntese de imagens Kandinsky 3.0 baseado em descrições de texto.

Em última análise, o algoritmo cria um vídeo com movimento do sujeito e do fundo. Isto distingue os vídeos gerados por uma rede neural dos vídeos animados, nos quais a dinâmica é obtida simulando o voo de uma câmera em relação a uma cena estática. Atualmente, o Kandinsky Video pode criar vídeos com resolução de 512×512 pixels e diferentes proporções. Para treinar o algoritmo, foi utilizado um conjunto de dados de mais de 300 mil pares texto-vídeo. O próprio processo de geração de vídeo leva até 3 minutos.

Observa-se que anteriormente alguns usuários da rede neural Kandinsky 2.2 em modo de teste obtiveram acesso à função de criação de vídeos animados. Apenas uma solicitação é suficiente para gerar um vídeo de até 4 segundos de duração com efeitos de animação selecionados, frequência de 24 quadros por segundo e resolução de 640 × 640 pixels. Os usuários da nova versão do Kandinsky 3.0 também podem gerar vídeos baseados em descrições de texto em modo de animação.

avalanche

Postagens recentes

A OpenAI pode processar a Apple pela má promoção do ChatGPT.

Segundo Mark Gurman, da Bloomberg, a OpenAI planeja processar a Apple devido ao relacionamento "tenso"…

9 horas atrás

O filme The Legend of Zelda será lançado antes do previsto – a estreia foi adiada novamente.

Shigeru Miyamoto, cocriador da série de jogos de ação e aventura The Legend of Zelda,…

9 horas atrás

O maior drone solar do mundo realizou um voo recorde e desapareceu no oceano.

O voo recorde de longa duração do singular avião não tripulado Skydweller, que durou do…

10 horas atrás

A Nvidia está a caminho de atingir uma capitalização de mercado de 6 trilhões de dólares, com suas ações subindo 20% em uma semana.

As ações da Nvidia subiram na quinta-feira, ampliando os ganhos de 20% acumulados nos últimos…

10 horas atrás

A Microsoft está preparando um controle Xbox compacto para jogos na nuvem.

Fontes internas relatam que a Microsoft está desenvolvendo um novo controle compacto para Xbox voltado…

11 horas atrás

A Razer apresenta o notebook gamer Blade 18 com desempenho de desktop.

A Razer anunciou hoje seu laptop mais poderoso de todos os tempos, o Blade 18.…

11 horas atrás