A equipe do Google DeepMind revelou o Genie 2, a segunda versão de um modelo fundamental de IA capaz de gerar novos ambientes digitais interativos, ou mundos de jogos, dinamicamente.
Fonte da imagem: Google
Para recapitular, o Genie original foi lançado em fevereiro e poderia gerar mundos virtuais 2D a partir de imagens sintetizadas. O Genie 2 é capaz de fazer isso em 3D e baseado em comandos de texto.
O usuário pode descrever o mundo desejado, selecionar uma renderização adequada e entrar em um novo ambiente. A cada passo, uma pessoa/agente realiza uma ação (mover o mouse, pressionar uma tecla do teclado) e o Genie 2 simula suas consequências.
Cada exemplo é baseado em uma imagem gerada pelo modelo de IA do Imagen 3 com base em um prompt de texto.
De acordo com o Google DeepMind, o Genie 2 pode gerar mundos interativos sequenciais que duram cerca de um minuto, embora a maioria dos exemplos mostrados (veja o vídeo abaixo) durem de 10 a 20 segundos.
Comparado com a primeira versão do Genie 2:
De acordo com o Google DeepMind, o Genie 2 demonstra o potencial dos modelos fundamentais do mundo para criar uma variedade de ambientes tridimensionais e acelerar o treinamento/teste de agentes de IA (como SIMA).
O Google DeepMind esclarece que a pesquisa está em um estágio inicial e requer melhorias significativas nas áreas de capacidades dos agentes e geração de ambientes, mas já vê o Genie 2 como uma solução para o problema estrutural de treinar agentes de IA com segurança.
Em 1975, uma aposta curiosa foi feita na URSS entre cientistas do Instituto de Ciências…
Processador Intel Core 2 Duo E4600 2.4 GHz / AMD Athlon 64 X2 4600 2.4…
A Intel foi a primeira a desenvolver uma arquitetura de chiplets claramente desagregada — as…
A maioria dos videogames é projetada para proporcionar diversão e entretenimento, mas o jogo de…
A partir de 1º de janeiro de 2026, o serviço de streaming de jogos GeForce…
Na CES 2026, a LG planeja apresentar um robô humanoide para tarefas domésticas rotineiras. Sob…