A divisão DeepMind do Google revelou o Veo 2, um gerador de vídeo de última geração alimentado por IA. Ele cria vídeos em resolução 4K (4096 × 2160 pixels) com até dois minutos de duração. Assim, é 4 vezes mais rápido que o OpenAI Sora em resolução e 6 vezes mais rápido em duração de vídeo.
Fonte da imagem: Google DeepMind
No momento, essa vantagem, porém, é apenas teórica: o Veo 2 só pode ser testado no site experimental VideoFX, onde a resolução é limitada a 720p e a duração do vídeo é de 8 segundos. Em comparação, a versão pública do gerador Sora da OpenAI oferece 1080p e 20 segundos. Para começar a usar o VideoFX, você terá que se inscrever em uma lista de espera, embora o Google tenha prometido expandir seu público esta semana. No futuro, o Veo 2 aparecerá na plataforma Vertex AI para usuários corporativos, mas o Google não indicou o momento exato.
O Veo 2, assim como seu antecessor, gera vídeos baseados em instruções de texto que podem ser acompanhadas de imagens. Comparado ao Veo de primeira geração, o novo modelo “entende” melhor a física, a imagem aumentou a clareza e os mecanismos de movimentação da câmera virtual foram aprimorados. O Veo 2 simula o movimento de forma mais realista (por exemplo, representando o café sendo servido em uma caneca) e as propriedades da luz (sombra e reflexo); Diferentes lentes em uma câmera virtual e efeitos cinematográficos são simulados de forma realista.
O desenvolvedor também afirma que o novo modelo tem menos probabilidade de apresentar alucinações: dedos extras ou “objetos inesperados”; No entanto, como a prática tem mostrado, não foi possível eliminar o efeito do “vale misterioso”. E no vídeo de um carro em movimento, olhando mais de perto, a estrada parece extremamente plana, os pedestres se misturam e algumas fachadas de casas têm uma aparência que desafia as leis da física.
O novo gerador de vídeo foi treinado em um grande número de vídeos; A DeepMind não especificou quais fontes foram usadas para isso, mas uma delas provavelmente é a plataforma YouTube, de propriedade do Google. Para reduzir o risco de deepfakes, o Veo 2 possui um sistema SynthID integrado – marcação invisível de vídeos gerados por modelo.
A DeepMind também anunciou que melhorou o desempenho do gerador de imagens estáticas Imagen 3 – as imagens criadas com sua ajuda tornaram-se mais brilhantes, mais detalhadas e o próprio modelo agora segue com mais precisão as solicitações do usuário. A interface de usuário do ImageFX, onde o gerador de imagens está disponível, agora possui listas suspensas que aparecem diretamente no campo de consulta e ajudam você a obter resultados mais precisos.
Segundo uma reportagem recente da Bloomberg, a Sony está considerando adiar o lançamento do seu…
Como parte de sua estratégia de desenvolvimento atualizada, a Intel confirmou seus planos de lançar…
Uma demo de Darkhaven, um RPG de ação e fantasia sombria de nova geração da…
Inúmeros usuários relataram que a rede social X estava indisponível. Os relatos de problemas começaram…
O usuário do YouTube Gwak revelou uma versão verdadeiramente enorme de uma caixa de som…
A semana de 16 a 22 de fevereiro foi especialmente diversificada, com aventuras sombrias em…