O Google DeepMind apresentou o gerador de vídeo AI Veo 2, que cria vídeos de dois minutos em 4K

A divisão DeepMind do Google revelou o Veo 2, um gerador de vídeo de última geração alimentado por IA. Ele cria vídeos em resolução 4K (4096 × 2160 pixels) com até dois minutos de duração. Assim, é 4 vezes mais rápido que o OpenAI Sora em resolução e 6 vezes mais rápido em duração de vídeo.

Fonte da imagem: Google DeepMind

No momento, essa vantagem, porém, é apenas teórica: o Veo 2 só pode ser testado no site experimental VideoFX, onde a resolução é limitada a 720p e a duração do vídeo é de 8 segundos. Em comparação, a versão pública do gerador Sora da OpenAI oferece 1080p e 20 segundos. Para começar a usar o VideoFX, você terá que se inscrever em uma lista de espera, embora o Google tenha prometido expandir seu público esta semana. No futuro, o Veo 2 aparecerá na plataforma Vertex AI para usuários corporativos, mas o Google não indicou o momento exato.

O Veo 2, assim como seu antecessor, gera vídeos baseados em instruções de texto que podem ser acompanhadas de imagens. Comparado ao Veo de primeira geração, o novo modelo “entende” melhor a física, a imagem aumentou a clareza e os mecanismos de movimentação da câmera virtual foram aprimorados. O Veo 2 simula o movimento de forma mais realista (por exemplo, representando o café sendo servido em uma caneca) e as propriedades da luz (sombra e reflexo); Diferentes lentes em uma câmera virtual e efeitos cinematográficos são simulados de forma realista.

O desenvolvedor também afirma que o novo modelo tem menos probabilidade de apresentar alucinações: dedos extras ou “objetos inesperados”; No entanto, como a prática tem mostrado, não foi possível eliminar o efeito do “vale misterioso”. E no vídeo de um carro em movimento, olhando mais de perto, a estrada parece extremamente plana, os pedestres se misturam e algumas fachadas de casas têm uma aparência que desafia as leis da física.

O novo gerador de vídeo foi treinado em um grande número de vídeos; A DeepMind não especificou quais fontes foram usadas para isso, mas uma delas provavelmente é a plataforma YouTube, de propriedade do Google. Para reduzir o risco de deepfakes, o Veo 2 possui um sistema SynthID integrado – marcação invisível de vídeos gerados por modelo.

A DeepMind também anunciou que melhorou o desempenho do gerador de imagens estáticas Imagen 3 – as imagens criadas com sua ajuda tornaram-se mais brilhantes, mais detalhadas e o próprio modelo agora segue com mais precisão as solicitações do usuário. A interface de usuário do ImageFX, onde o gerador de imagens está disponível, agora possui listas suspensas que aparecem diretamente no campo de consulta e ajudam você a obter resultados mais precisos.

avalanche

Postagens recentes

PlayStation 6 pode ter que esperar até 2028-2029 – Sony considera adiamento devido à crise de memória

Segundo uma reportagem recente da Bloomberg, a Sony está considerando adiar o lançamento do seu…

2 horas atrás

As GPUs Xe Next de próxima geração da Intel serão otimizadas para IA, não para jogos.

Como parte de sua estratégia de desenvolvimento atualizada, a Intel confirmou seus planos de lançar…

3 horas atrás

Os desenvolvedores veteranos de Diablo lançaram uma demo em grande escala do RPG de ação de próxima geração, Darkhaven, no Steam.

Uma demo de Darkhaven, um RPG de ação e fantasia sombria de nova geração da…

3 horas atrás

Milhares de usuários reclamaram de problemas com a rede social X.

Inúmeros usuários relataram que a rede social X estava indisponível. Os relatos de problemas começaram…

4 horas atrás

Calendário de lançamentos – 16 a 22 de fevereiro: Styx: Blades of Greed, Norse: Oath of Blood e Forgotlings.

A semana de 16 a 22 de fevereiro foi especialmente diversificada, com aventuras sombrias em…

4 horas atrás