Em agosto, o Google apresentou o Genie 3, um “modelo de mundo de propósito geral capaz de gerar uma variedade de ambientes de jogos”. Agora, os assinantes do plano Ultra AI do Google nos EUA podem experimentá-lo na plataforma Project Genie.

Fonte da imagem: Google

O objetivo do modelo do mundo é simular a dinâmica do ambiente, prevendo seu desenvolvimento e mudanças sob a influência de diversas ações; o sistema foi projetado para navegar pela diversidade do mundo real. O protótipo experimental de pesquisa pede ao usuário que descreva um espaço de sua escolha respondendo à pergunta “Como é o seu mundo?” e ​​um método de navegação: caminhando, dirigindo, voando e em perspectiva de primeira ou terceira pessoa. Em seguida, o usuário descreve o personagem principal — que pode ser uma pessoa, um animal, alguém ou algo mais — após o qual o Project Genie gera um esboço usando o modelo Nano Banana Pro. O usuário obtém uma prévia de como será o mundo gerado e pode fazer alterações antes de entrar nele.

Mundos fotorrealistas são gerados em resolução 720p, com interações renderizadas a 20 a 24 quadros por segundo; o tempo da sessão é limitado a 60 segundos. Ao se mover, o Genie 3 “gera um caminho em tempo real com base em suas ações”. A física e as interações com objetos são simuladas com “estabilidade inovadora”, afirma o Google. É possível ajustar a posição da câmera e baixar vídeos de tutoriais em mundos virtuais. Outro recurso é a criação de remixes do mundo com base em consultas de texto ou em um gerador de números aleatórios.

Além do limite de 60 segundos, o Google alertou que o mundo gerado por IA pode não parecer totalmente realista e pode nem sempre “corresponder com precisão às consultas, imagens e às leis da física do mundo real”. Personagens personalizados também não são perfeitos — eles “podem não ser totalmente controláveis ​​ou apresentar latência significativa”.Ao lançar o Project Genie, o Google pretende “entender melhor como as pessoas usarão modelos do mundo em diversas áreas, incluindo pesquisas em IA e mídia generativa”. Na prática, a tecnologia tem potencial em “robótica e modelagem, animação e ficção, e exploração de locais e sítios históricos”, segundo o Google. Usuários com 18 anos ou mais podem usar o serviço.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *