Google introduziu uma rede neural que gera vídeo HD a partir de uma descrição de texto

O Google falou sobre o sistema de inteligência artificial Imagen Video, que gera vídeo de alta resolução (1280 × 768 pixels, 24 quadros por segundo) a partir de uma descrição de texto. No entanto, por medo de que o modelo gere conteúdo impróprio, a empresa decidiu se abster de publicar o código-fonte do projeto por enquanto.

Fonte da imagem: imagen.research.google

Na descrição (PDF) da solução, o Google observou que o Imagen Video é capaz de trabalhar em um determinado estilo, imitando, por exemplo, os modos de artistas famosos, criar objetos 3D giratórios mantendo sua forma ou retratar texto em várias animações gêneros. A tecnologia assenta numa “cascata” de modelos que, a partir de uma descrição textual, criam um protótipo de vídeo (16 frames numa resolução de 24×48 pixels a uma frequência de 3 frames por segundo), que é depois convertido num vídeo vídeo de alta resolução com uma taxa de quadros mais alta em várias etapas. O vídeo final tem 5,3 segundos de duração.

Os exemplos apresentados no Imagen Video variam de cenas simples como “Sorvete de pistache derretendo pingando em um copo” a cenários intrincados como “Voando em uma batalha de navios piratas em um oceano tempestuoso”. As imagens contêm artefatos óbvios, mas seus detalhes e suavidade são notavelmente maiores do que os das contrapartes existentes. Paralelamente, outro modelo de IA do Google estreou para gerar vídeos a partir de uma descrição de texto – Phenaki cria vídeos mais longos.

O Google disse que o sistema Imagen Video foi treinado no LAION-400M, disponível publicamente, que contém “14 milhões de pares de vídeo-texto e 60 milhões de pares de imagem-texto”. Segundo a empresa, trata-se de “dados problemáticos” e, embora especialistas tenham tentado filtrá-los, ainda é possível que o modelo gere conteúdo inadequado contendo cenas de natureza sensível, violência, estereótipos sociais e preconceito cultural. E “até que essas preocupações sejam resolvidas”, o código-fonte do modelo Imagen Video não será publicado.

avalanche

Postagens recentes

A Guerrilla Games concentrou quase todos os seus recursos no jogo como serviço Horizon: Hunters & Gathering, não sendo Horizon 3 uma prioridade.

Horizon Hunters Gathering, o jogo de ação cooperativo para três jogadores da Guerrilla Games anunciado…

36 minutos atrás

Elon Musk prometeu iniciar a construção de uma base em Marte dentro de cinco a sete anos.

Na semana passada, o The Wall Street Journal noticiou que a SpaceX estava mudando suas…

5 horas atrás

A Samsung começará a comercializar a memória HBM4 em fevereiro, antes da concorrência.

A Samsung Electronics será a primeira fabricante de memórias a iniciar os envios comerciais de…

5 horas atrás

A ascensão da programação baseada em vibrações prejudicou o ecossistema de código aberto e pode levar ao desastre.

Pesquisadores da Universidade da Europa Central, em Viena, concluíram que a prática de programação usando…

8 horas atrás

A data de lançamento do iOS 26.4, que inclui a Siri inteligente e um baú do tesouro, foi anunciada.

A Apple está se preparando para lançar a primeira versão beta do iOS 26.4 para…

10 horas atrás

A Team Vitality sagrou-se campeã do IEM Krakow 2026 na categoria CS2 e faturou mais de US$ 400.000 pelo segundo ano consecutivo.

Hoje, um dos torneios de Counter-Strike mais prestigiados, o IEM Krakow 2026, sucessor do lendário…

10 horas atrás