O Google DeepMind apresentou o gerador de vídeo AI Veo 2, que cria vídeos de dois minutos em 4K

A divisão DeepMind do Google revelou o Veo 2, um gerador de vídeo de última geração alimentado por IA. Ele cria vídeos em resolução 4K (4096 × 2160 pixels) com até dois minutos de duração. Assim, é 4 vezes mais rápido que o OpenAI Sora em resolução e 6 vezes mais rápido em duração de vídeo.

Fonte da imagem: Google DeepMind

No momento, essa vantagem, porém, é apenas teórica: o Veo 2 só pode ser testado no site experimental VideoFX, onde a resolução é limitada a 720p e a duração do vídeo é de 8 segundos. Em comparação, a versão pública do gerador Sora da OpenAI oferece 1080p e 20 segundos. Para começar a usar o VideoFX, você terá que se inscrever em uma lista de espera, embora o Google tenha prometido expandir seu público esta semana. No futuro, o Veo 2 aparecerá na plataforma Vertex AI para usuários corporativos, mas o Google não indicou o momento exato.

O Veo 2, assim como seu antecessor, gera vídeos baseados em instruções de texto que podem ser acompanhadas de imagens. Comparado ao Veo de primeira geração, o novo modelo “entende” melhor a física, a imagem aumentou a clareza e os mecanismos de movimentação da câmera virtual foram aprimorados. O Veo 2 simula o movimento de forma mais realista (por exemplo, representando o café sendo servido em uma caneca) e as propriedades da luz (sombra e reflexo); Diferentes lentes em uma câmera virtual e efeitos cinematográficos são simulados de forma realista.

O desenvolvedor também afirma que o novo modelo tem menos probabilidade de apresentar alucinações: dedos extras ou “objetos inesperados”; No entanto, como a prática tem mostrado, não foi possível eliminar o efeito do “vale misterioso”. E no vídeo de um carro em movimento, olhando mais de perto, a estrada parece extremamente plana, os pedestres se misturam e algumas fachadas de casas têm uma aparência que desafia as leis da física.

O novo gerador de vídeo foi treinado em um grande número de vídeos; A DeepMind não especificou quais fontes foram usadas para isso, mas uma delas provavelmente é a plataforma YouTube, de propriedade do Google. Para reduzir o risco de deepfakes, o Veo 2 possui um sistema SynthID integrado – marcação invisível de vídeos gerados por modelo.

A DeepMind também anunciou que melhorou o desempenho do gerador de imagens estáticas Imagen 3 – as imagens criadas com sua ajuda tornaram-se mais brilhantes, mais detalhadas e o próprio modelo agora segue com mais precisão as solicitações do usuário. A interface de usuário do ImageFX, onde o gerador de imagens está disponível, agora possui listas suspensas que aparecem diretamente no campo de consulta e ajudam você a obter resultados mais precisos.

avalanche

Postagens recentes

O Rei Está Nu: VDURA Confiante de que os SSDs não Substituirão os HDDs nos Data Centers

Segundo Ken Claffey, CEO da VDURA, o aumento dos preços e a escassez de memória…

1 hora atrás

Mouse: Detetive Particular para Contratar – Uma Perdição em Preto e Branco com Ratos. Análise / Jogos

Processador Intel Core i5-9500 de 3,0 GHz / AMD Ryzen 5 3400G de 3,7 GHz,…

2 horas atrás

Mouse: Detetive Particular para Contratar – Uma Perdição em Preto e Branco com Ratos. Resenha

Processador Intel Core i5-9500 de 3,0 GHz / AMD Ryzen 5 3400G de 3,7 GHz,…

2 horas atrás

“Estão enferrujados”: os módulos da estação orbital lunar Lunar Gateway da NASA entraram em estado de deterioração enquanto ainda estavam na Terra.

Durante dez anos, a NASA promoveu a ideia de construir uma estação espacial chamada Lunar…

3 horas atrás

Físicos criaram uma câmera totalmente nova para detectar neutrinos e matéria escura.

Uma equipe internacional de cientistas, liderada por físicos suíços, apresentou um método revolucionário para a…

3 horas atrás

“Abriu um novo capítulo para os Jogos Coreanos”: Crimson Desert conquistou o respeito do primeiro-ministro sul-coreano.

O sucesso estrondoso do jogo de ação e aventura em mundo aberto Crimson Desert, da…

4 horas atrás