Google treina IA para criar mundos 3D vivos que não se desintegram em um minuto – Genie 3 abrirá caminho para a IA

O Google DeepMind lançou uma nova versão do seu modelo de mundo de IA, o Genie 3, que pode gerar ambientes 3D com os quais é possível interagir em tempo real. A empresa afirma que os usuários poderão explorar os mundos gerados por muito mais tempo do que antes, e o modelo memorizará a localização de objetos que permanecem fora do quadro. Os modelos de mundo também são um passo importante em direção a uma “IA forte”, pois permitem que a IA seja treinada sem restrições em um ambiente rico.

Fonte da imagem: Google

Modelos de mundo, ou modelos de mundo, são um tipo de sistema de IA que pode simular ambientes tridimensionais para fins educacionais, de entretenimento e científicos, bem como para treinar robôs ou agentes de IA. O espaço gerado pode ser navegado pelo usuário com base em instruções de texto, de forma semelhante a um videogame. O Google está investindo fortemente nessa área de IA. Em dezembro, a empresa revelou o Genie 2, que pode criar mundos interativos a partir de imagens, e agora está formando uma nova equipe de modelagem de mundos liderada pelo ex-desenvolvedor líder do gerador de vídeo Sora, da OpenAI.

Os modelos de mundo existentes ainda apresentam muitas deficiências. Por exemplo, você só pode permanecer no mundo gerado pelo Genie 2 por um minuto. Segundo especialistas, esses mundos eram mais como “andar por uma versão borrada do Google Street View, onde tudo mudava e se transformava de maneiras inesperadas quando o usuário desviava o olhar”.

O Genie 3 parece estar prestes a representar um avanço significativo. Os desenvolvedores afirmam que os usuários poderão criar mundos que suportam “vários” minutos de interação contínua. O Genie 3 pode armazenar objetos gerados na memória por cerca de um minuto, permitindo que o usuário retorne a eles e os encontre no mesmo lugar.

O Genie 3 apresenta o que chama de “eventos mundiais sugeridos”, que permitem alterar as condições climáticas ou adicionar novos personagens em tempo real. O Google afirma que atualmente há maneiras limitadas de interagir com os mundos gerados, e o texto legível “geralmente só aparece se estiver presente na descrição original do mundo”.

Nesta fase, os mundos simulados produzidos estão rodando em resolução de 720p e 24 quadros por segundo. O Genie 3 ainda não está disponível ao público em geral. O Google afirma que se trata de uma “prévia de pesquisa limitada”, disponível para “um pequeno grupo de cientistas e desenvolvedores” para avaliar cuidadosamente os riscos potenciais e como mitigá-los. A empresa afirma estar “explorando” como disponibilizar o Genie 3 para “testadores adicionais” no futuro.

admin

Postagens recentes

A China vai proibir carros elétricos com maçanetas retráteis a partir de 2027.

A China vai proibir a venda de novos veículos elétricos equipados com maçanetas retráteis. Esse…

39 minutos atrás

A fabricante chinesa Zephyr relatou falhas na placa de vídeo Radeon RX 6000 devido a rachaduras, inchaço e curto-circuito na GPU.

Em 2023, começaram a surgir relatos de falhas em placas gráficas Radeon RX 6000 baseadas…

1 hora atrás

A TSMC evacuou algumas de suas fábricas devido ao terremoto.

A TSMC de Taiwan, maior fabricante de chips sob encomenda do mundo, informou no sábado…

4 horas atrás

Entusiastas chineses começaram a aumentar a memória de vídeo da GeForce RTX 5080 para 32 GB.

Especialistas chineses em reparo de placas de vídeo descobriram uma maneira de aumentar a memória…

5 horas atrás

O YouTube está bombardeando novos usuários com conteúdo de baixa qualidade gerado por IA.

A empresa de edição de vídeo Kapwing estudou 15.000 dos canais mais populares do YouTube…

6 horas atrás