Em agosto, o Google apresentou o Genie 3, um “modelo de mundo de propósito geral capaz de gerar uma variedade de ambientes de jogos”. Agora, os assinantes do plano Ultra AI do Google nos EUA podem experimentá-lo na plataforma Project Genie.
Fonte da imagem: Google
O objetivo do modelo do mundo é simular a dinâmica do ambiente, prevendo seu desenvolvimento e mudanças sob a influência de diversas ações; o sistema foi projetado para navegar pela diversidade do mundo real. O protótipo experimental de pesquisa pede ao usuário que descreva um espaço de sua escolha respondendo à pergunta “Como é o seu mundo?” e um método de navegação: caminhando, dirigindo, voando e em perspectiva de primeira ou terceira pessoa. Em seguida, o usuário descreve o personagem principal — que pode ser uma pessoa, um animal, alguém ou algo mais — após o qual o Project Genie gera um esboço usando o modelo Nano Banana Pro. O usuário obtém uma prévia de como será o mundo gerado e pode fazer alterações antes de entrar nele.
Mundos fotorrealistas são gerados em resolução 720p, com interações renderizadas a 20 a 24 quadros por segundo; o tempo da sessão é limitado a 60 segundos. Ao se mover, o Genie 3 “gera um caminho em tempo real com base em suas ações”. A física e as interações com objetos são simuladas com “estabilidade inovadora”, afirma o Google. É possível ajustar a posição da câmera e baixar vídeos de tutoriais em mundos virtuais. Outro recurso é a criação de remixes do mundo com base em consultas de texto ou em um gerador de números aleatórios.
Além do limite de 60 segundos, o Google alertou que o mundo gerado por IA pode não parecer totalmente realista e pode nem sempre “corresponder com precisão às consultas, imagens e às leis da física do mundo real”. Personagens personalizados também não são perfeitos — eles “podem não ser totalmente controláveis ou apresentar latência significativa”.Ao lançar o Project Genie, o Google pretende “entender melhor como as pessoas usarão modelos do mundo em diversas áreas, incluindo pesquisas em IA e mídia generativa”. Na prática, a tecnologia tem potencial em “robótica e modelagem, animação e ficção, e exploração de locais e sítios históricos”, segundo o Google. Usuários com 18 anos ou mais podem usar o serviço.
As versões mais recentes do Windows 11, disponíveis através do programa Windows Insider, introduziram uma…
A corrida armamentista da cibersegurança continua: os métodos de invasão de computadores e as contramedidas…
O novo MacBook Neo da Apple, com preço a partir de US$ 599 e processador…
A Curator, empresa especializada em garantir a disponibilidade da internet e mitigar ataques DDoS, anunciou…
A Microsoft apresentou o Copilot Health, um "espaço especial" dentro de seu assistente de IA…
A Openreach, subsidiária da BT e provedora britânica de telecomunicações, participou de um experimento inusitado…