Sber apresentou a rede neural Kandinsky Video – ela gera vídeos de 8 segundos com base na descrição do texto

«Sber apresentou a rede neural Kandinsky Video, capaz de criar vídeos curtos a partir de uma descrição de texto. O algoritmo gera sequências de vídeo de até 8 segundos de duração a uma frequência de 30 quadros por segundo. O novo produto foi apresentado na conferência AI Journey pelo primeiro vice-presidente do conselho do Sberbank, Alexander Vedyakhin.

Fonte da imagem: sberbank.com

A arquitetura do Kandinsky Video inclui dois blocos principais. O primeiro bloco é responsável por gerar quadros-chave utilizados para criar a estrutura do enredo do vídeo, e o segundo gera quadros de interpolação, conseguindo assim um movimento suave no vídeo final. Ambos os blocos são construídos com base no modelo de síntese de imagens Kandinsky 3.0 baseado em descrições de texto.

Em última análise, o algoritmo cria um vídeo com movimento do sujeito e do fundo. Isto distingue os vídeos gerados por uma rede neural dos vídeos animados, nos quais a dinâmica é obtida simulando o voo de uma câmera em relação a uma cena estática. Atualmente, o Kandinsky Video pode criar vídeos com resolução de 512×512 pixels e diferentes proporções. Para treinar o algoritmo, foi utilizado um conjunto de dados de mais de 300 mil pares texto-vídeo. O próprio processo de geração de vídeo leva até 3 minutos.

Observa-se que anteriormente alguns usuários da rede neural Kandinsky 2.2 em modo de teste obtiveram acesso à função de criação de vídeos animados. Apenas uma solicitação é suficiente para gerar um vídeo de até 4 segundos de duração com efeitos de animação selecionados, frequência de 24 quadros por segundo e resolução de 640 × 640 pixels. Os usuários da nova versão do Kandinsky 3.0 também podem gerar vídeos baseados em descrições de texto em modo de animação.

avalanche

Postagens recentes

A União Europeia está forçando o Google a abrir o Android para concorrentes do Gemini.

O Google está enfrentando crescente pressão da União Europeia para permitir que assistentes de IA…

26 minutos atrás

Elon Musk terá que devolver US$ 29 bilhões à Tesla para receber seu bônus de longa data de US$ 56 bilhões.

Em 21 de abril, o conselho de administração da Tesla revogou por unanimidade uma bonificação…

1 hora atrás

A Honor apresentou o poderoso notebook gamer Win H9 com seis ventoinhas para operação silenciosa.

A Honor apresentou o notebook gamer Win H9. O sistema vem equipado com seis ventoinhas…

1 hora atrás

A Marvell adquire a Polariton, desenvolvedora de soluções plasmônicas.

A Marvell Technology anunciou a aquisição da Polariton Technologies, desenvolvedora de dispositivos fotônicos de alta…

2 horas atrás

Tim Cook revelou seu primeiro grande erro como CEO da Apple.

O CEO da Apple, Tim Cook, classificou o lançamento fracassado do Apple Maps em 2012…

2 horas atrás

A BioWare está muito ocupada para mostrar o novo Mass Effect.

Michael Gamble, produtor executivo e diretor de desenvolvimento do novo Mass Effect da BioWare, comentou…

3 horas atrás