A divisão DeepMind do Google revelou o Veo 2, um gerador de vídeo de última geração alimentado por IA. Ele cria vídeos em resolução 4K (4096 × 2160 pixels) com até dois minutos de duração. Assim, é 4 vezes mais rápido que o OpenAI Sora em resolução e 6 vezes mais rápido em duração de vídeo.
Fonte da imagem: Google DeepMind
No momento, essa vantagem, porém, é apenas teórica: o Veo 2 só pode ser testado no site experimental VideoFX, onde a resolução é limitada a 720p e a duração do vídeo é de 8 segundos. Em comparação, a versão pública do gerador Sora da OpenAI oferece 1080p e 20 segundos. Para começar a usar o VideoFX, você terá que se inscrever em uma lista de espera, embora o Google tenha prometido expandir seu público esta semana. No futuro, o Veo 2 aparecerá na plataforma Vertex AI para usuários corporativos, mas o Google não indicou o momento exato.
O Veo 2, assim como seu antecessor, gera vídeos baseados em instruções de texto que podem ser acompanhadas de imagens. Comparado ao Veo de primeira geração, o novo modelo “entende” melhor a física, a imagem aumentou a clareza e os mecanismos de movimentação da câmera virtual foram aprimorados. O Veo 2 simula o movimento de forma mais realista (por exemplo, representando o café sendo servido em uma caneca) e as propriedades da luz (sombra e reflexo); Diferentes lentes em uma câmera virtual e efeitos cinematográficos são simulados de forma realista.
O desenvolvedor também afirma que o novo modelo tem menos probabilidade de apresentar alucinações: dedos extras ou “objetos inesperados”; No entanto, como a prática tem mostrado, não foi possível eliminar o efeito do “vale misterioso”. E no vídeo de um carro em movimento, olhando mais de perto, a estrada parece extremamente plana, os pedestres se misturam e algumas fachadas de casas têm uma aparência que desafia as leis da física.
O novo gerador de vídeo foi treinado em um grande número de vídeos; A DeepMind não especificou quais fontes foram usadas para isso, mas uma delas provavelmente é a plataforma YouTube, de propriedade do Google. Para reduzir o risco de deepfakes, o Veo 2 possui um sistema SynthID integrado – marcação invisível de vídeos gerados por modelo.
A DeepMind também anunciou que melhorou o desempenho do gerador de imagens estáticas Imagen 3 – as imagens criadas com sua ajuda tornaram-se mais brilhantes, mais detalhadas e o próprio modelo agora segue com mais precisão as solicitações do usuário. A interface de usuário do ImageFX, onde o gerador de imagens está disponível, agora possui listas suspensas que aparecem diretamente no campo de consulta e ajudam você a obter resultados mais precisos.
Os fabricantes chineses de memória também estão se beneficiando do boom da IA. Isso é…
Especialistas entrevistados pelo Financial Times concordam que, embora os desenvolvedores americanos de IA sejam líderes…
Os processadores Arrow Lake para desktops estão no mercado há um ano e meio, mas,…
De acordo com a Reuters, citando uma declaração do primeiro-ministro do país, as autoridades sul-coreanas…
Esta semana, o Google apresentou o Gemini Intelligence, um conjunto de recursos com inteligência artificial…
A Huawei iniciou a venda de versões recondicionadas dos smartphones dobráveis Mate XT Tri-Fold e…