Stability AI apresentou o gerador de vídeo 4D Stable Video 4D

Com a popularidade das redes neurais generativas, muitos algoritmos de IA para criação de vídeos já estão disponíveis, como Sora, Haiper e Luma AI. Os desenvolvedores da Stability AI introduziram algo completamente novo. Estamos falando da rede neural Stable Video 4D, que se baseia no modelo Stable Video Diffusion existente, que permite converter imagens em vídeo. A nova ferramenta leva esse conceito ainda mais longe, criando vários vídeos de 8 perspectivas diferentes a partir dos dados de vídeo resultantes.

Difusão Estável 3

«Acreditamos que o Stable Video 4D será usado em filmes, jogos, AR/VR e outras áreas onde há necessidade de visualizar objetos 3D em movimento dinâmico a partir de ângulos arbitrários”, disse Varun Jampani, chefe de pesquisa 3D da Stability AI Jampani).

Esta não é a primeira vez que o Stability AI vai além da geração de vídeo 2D. Em março, a empresa anunciou o algoritmo Stable Video 3D, que permite aos usuários criar pequenos vídeos 3D com base em uma imagem ou descrição de texto. Com o lançamento do Stable Video 4D, a empresa dá um passo significativo. Embora o conceito de 3D ou três dimensões seja geralmente entendido como um tipo de imagem ou vídeo com profundidade, o 4D não acrescenta outra dimensão. Na verdade, 4D inclui largura (x), altura (y), profundidade (z) e tempo (t). Isso significa que o Stable Video 4D permite visualizar objetos 3D em movimento de diferentes pontos de vista e em diferentes momentos.

«Os principais aspectos que nos permitiram criar Stable Video 4D foram que combinamos os pontos fortes de nossos modelos Stable Video Diffusion e Stable Video 3D lançados anteriormente e os aprimoramos com um conjunto de dados cuidadosamente curado de objetos 3D em movimento dinâmico”, explicou Jampani. Ele também acrescentou que Stable Video 4D é o primeiro algoritmo desse tipo no qual uma única rede neural realiza síntese de imagem e geração de vídeo. Análogos já existentes usam redes neurais separadas para resolver esses problemas.

«O Stable Video 4D sintetiza completamente oito novos vídeos do zero, usando o vídeo de entrada como guia. Não há transferência explícita de informações sobre pixels da entrada para a saída; toda essa transferência de informações é realizada implicitamente pela rede neural”, acrescentou Jampani. Ele acrescentou que atualmente o Stable Video 4D pode lidar com vídeo de um único objeto com duração de vários segundos com um fundo simples. No futuro, os desenvolvedores planejam melhorar o algoritmo para que ele possa ser usado no processamento de vídeos mais complexos.

avalanche

Postagens recentes

A Xiaomi lançará dois crossovers híbridos e duas versões atualizadas do sedã SU7 este ano.

A Xiaomi é uma empresa muito jovem no mercado automotivo, mas isso não a impediu…

32 minutos atrás

A Colorful quebrou o recorde mundial de overclock do processador AMD Ryzen 7 9800X3D – agora ele alcançou 7335,48 MHz.

A Colorful estabeleceu um recorde mundial de overclocking para um processador AMD Ryzen 7 9800X3D…

54 minutos atrás

A ASRock se tornou fabricante de sistemas de refrigeração líquida e anunciou diversas linhas de produtos simultaneamente.

A ASRock decidiu expandir sua linha de produtos e, além das placas-mãe tradicionais com placas…

1 hora atrás

A Asus aumentará os preços de PCs e laptops a partir de 5 de janeiro devido ao aumento dos custos de memória.

O aumento acentuado nos preços dos módulos de memória está forçando os fabricantes de computadores…

2 horas atrás

O MacBook Air mais recente com chip Intel, o Apple Watch 5 e vários outros dispositivos foram classificados como vintage.

A Apple atualizou sua lista de produtos clássicos, adicionando vários dispositivos de uma só vez.…

2 horas atrás

Não recomendado para pessoas de coração fraco: os japoneses criaram uma réplica anatomicamente precisa de um cão robótico, com músculos e sem pele.

Todos os principais desenvolvedores de robôs quadrúpedes têm se baseado em motores elétricos para acionar…

3 horas atrás