O Google DeepMind apresentou o gerador de vídeo AI Veo 2, que cria vídeos de dois minutos em 4K

A divisão DeepMind do Google revelou o Veo 2, um gerador de vídeo de última geração alimentado por IA. Ele cria vídeos em resolução 4K (4096 × 2160 pixels) com até dois minutos de duração. Assim, é 4 vezes mais rápido que o OpenAI Sora em resolução e 6 vezes mais rápido em duração de vídeo.

Fonte da imagem: Google DeepMind

No momento, essa vantagem, porém, é apenas teórica: o Veo 2 só pode ser testado no site experimental VideoFX, onde a resolução é limitada a 720p e a duração do vídeo é de 8 segundos. Em comparação, a versão pública do gerador Sora da OpenAI oferece 1080p e 20 segundos. Para começar a usar o VideoFX, você terá que se inscrever em uma lista de espera, embora o Google tenha prometido expandir seu público esta semana. No futuro, o Veo 2 aparecerá na plataforma Vertex AI para usuários corporativos, mas o Google não indicou o momento exato.

O Veo 2, assim como seu antecessor, gera vídeos baseados em instruções de texto que podem ser acompanhadas de imagens. Comparado ao Veo de primeira geração, o novo modelo “entende” melhor a física, a imagem aumentou a clareza e os mecanismos de movimentação da câmera virtual foram aprimorados. O Veo 2 simula o movimento de forma mais realista (por exemplo, representando o café sendo servido em uma caneca) e as propriedades da luz (sombra e reflexo); Diferentes lentes em uma câmera virtual e efeitos cinematográficos são simulados de forma realista.

O desenvolvedor também afirma que o novo modelo tem menos probabilidade de apresentar alucinações: dedos extras ou “objetos inesperados”; No entanto, como a prática tem mostrado, não foi possível eliminar o efeito do “vale misterioso”. E no vídeo de um carro em movimento, olhando mais de perto, a estrada parece extremamente plana, os pedestres se misturam e algumas fachadas de casas têm uma aparência que desafia as leis da física.

O novo gerador de vídeo foi treinado em um grande número de vídeos; A DeepMind não especificou quais fontes foram usadas para isso, mas uma delas provavelmente é a plataforma YouTube, de propriedade do Google. Para reduzir o risco de deepfakes, o Veo 2 possui um sistema SynthID integrado – marcação invisível de vídeos gerados por modelo.

A DeepMind também anunciou que melhorou o desempenho do gerador de imagens estáticas Imagen 3 – as imagens criadas com sua ajuda tornaram-se mais brilhantes, mais detalhadas e o próprio modelo agora segue com mais precisão as solicitações do usuário. A interface de usuário do ImageFX, onde o gerador de imagens está disponível, agora possui listas suspensas que aparecem diretamente no campo de consulta e ajudam você a obter resultados mais precisos.

avalanche

Postagens recentes

O lucro trimestral da CXMT aumentou quase 18 vezes em meio à forte demanda por memória.

Os fabricantes chineses de memória também estão se beneficiando do boom da IA. Isso é…

40 minutos atrás

Empresas chinesas ultrapassaram suas rivais americanas na geração de vídeos com inteligência artificial.

Especialistas entrevistados pelo Financial Times concordam que, embora os desenvolvedores americanos de IA sejam líderes…

1 hora atrás

Análise do Intel Core Ultra 7 270K Plus: O melhor processador Arrow Lake pela metade do preço / Processadores e Memória

Os processadores Arrow Lake para desktops estão no mercado há um ano e meio, mas,…

7 horas atrás

O governo sul-coreano tentará impedir uma greve dos trabalhadores da Samsung.

De acordo com a Reuters, citando uma declaração do primeiro-ministro do país, as autoridades sul-coreanas…

8 horas atrás

Os recursos de IA do Gemini Intelligence do Google estarão disponíveis em alguns smartphones Android de última geração selecionados.

Esta semana, o Google apresentou o Gemini Intelligence, um conjunto de recursos com inteligência artificial…

11 horas atrás

A Huawei iniciou a venda de smartphones Mate XT e Mate X6 recondicionados.

A Huawei iniciou a venda de versões recondicionadas dos smartphones dobráveis ​​Mate XT Tri-Fold e…

12 horas atrás