O Google DeepMind lançou uma nova versão do seu modelo de mundo de IA, o Genie 3, que pode gerar ambientes 3D com os quais é possível interagir em tempo real. A empresa afirma que os usuários poderão explorar os mundos gerados por muito mais tempo do que antes, e o modelo memorizará a localização de objetos que permanecem fora do quadro. Os modelos de mundo também são um passo importante em direção a uma “IA forte”, pois permitem que a IA seja treinada sem restrições em um ambiente rico.

Fonte da imagem: Google

Modelos de mundo, ou modelos de mundo, são um tipo de sistema de IA que pode simular ambientes tridimensionais para fins educacionais, de entretenimento e científicos, bem como para treinar robôs ou agentes de IA. O espaço gerado pode ser navegado pelo usuário com base em instruções de texto, de forma semelhante a um videogame. O Google está investindo fortemente nessa área de IA. Em dezembro, a empresa revelou o Genie 2, que pode criar mundos interativos a partir de imagens, e agora está formando uma nova equipe de modelagem de mundos liderada pelo ex-desenvolvedor líder do gerador de vídeo Sora, da OpenAI.

Os modelos de mundo existentes ainda apresentam muitas deficiências. Por exemplo, você só pode permanecer no mundo gerado pelo Genie 2 por um minuto. Segundo especialistas, esses mundos eram mais como “andar por uma versão borrada do Google Street View, onde tudo mudava e se transformava de maneiras inesperadas quando o usuário desviava o olhar”.

O Genie 3 parece estar prestes a representar um avanço significativo. Os desenvolvedores afirmam que os usuários poderão criar mundos que suportam “vários” minutos de interação contínua. O Genie 3 pode armazenar objetos gerados na memória por cerca de um minuto, permitindo que o usuário retorne a eles e os encontre no mesmo lugar.

O Genie 3 apresenta o que chama de “eventos mundiais sugeridos”, que permitem alterar as condições climáticas ou adicionar novos personagens em tempo real. O Google afirma que atualmente há maneiras limitadas de interagir com os mundos gerados, e o texto legível “geralmente só aparece se estiver presente na descrição original do mundo”.

Nesta fase, os mundos simulados produzidos estão rodando em resolução de 720p e 24 quadros por segundo. O Genie 3 ainda não está disponível ao público em geral. O Google afirma que se trata de uma “prévia de pesquisa limitada”, disponível para “um pequeno grupo de cientistas e desenvolvedores” para avaliar cuidadosamente os riscos potenciais e como mitigá-los. A empresa afirma estar “explorando” como disponibilizar o Genie 3 para “testadores adicionais” no futuro.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *