Um grupo de pesquisadores da China e Cingapura ensinou IA baseada em OpenAI GPT-4V para jogar Red Dead Redemption 2 (RDR2). Em seu artigo, eles falaram sobre o conceito de General Computer Control (GCC) para IA e sobre o agente multimodal CRADLE – uma interface entre GPT-4V e RDR2. Na opinião deles, os principais problemas com o agente de IA do jogo surgiram ao usar a visão computacional.

Fonte da imagem: Rockstar

O objetivo dos pesquisadores era fazer com que a IA, alimentada por OpenAI GPT-4V, interagisse com um computador detectando sinais visuais e de áudio, assim como faz o usuário humano médio de PC. O projeto fornece informações sobre o quão longe os desenvolvedores de IA avançaram no movimento em direção à inteligência artificial geral (AGI).

Os pesquisadores escolheram o RDR2 porque possui “um sofisticado sistema de controle de caixa preta que incorpora as tarefas de computação mais exigentes e nos permite avaliar os limites de desempenho de nossa plataforma em tais ambientes virtuais”. Além disso, elementos da interface do usuário, como diálogos, ícones exclusivos, dicas e instruções no jogo, garantem que nenhum conhecimento básico seja considerado garantido, o que é ótimo para o treinamento de IA. Os pesquisadores afirmam que controlar o jogo usando mouse e teclado fornece o melhor treinamento para o GCC.

Como funciona o CRADLE / Fonte da imagem: arxiv.org

Os pesquisadores pretendiam demonstrar a capacidade da IA ​​de aprender um jogo do zero (sem acesso a qualquer estado interno do jogo ou API), da mesma forma que um ser humano faria. O agente de IA “jogou” o jogo, movendo-se pelo mundo e completando missões, seguindo o enredo principal de RDR2. No geral, o CRADLE foi um sucesso notável no RDR2. Ele foi capaz de “completar consistentemente todos os objetivos principais do enredo”, com exceção da missão Firestorm, missões que exigem a exploração de um mundo interior complexo e missões abertas de vários estágios.

Como o CRADLE executa tarefas do jogo / Fonte da imagem: arxiv.org

Os pesquisadores acreditam que o GPT4-V é responsável por algumas das dificuldades recorrentes que o CRADLE encontrou. Na sua opinião, “as capacidades de reconhecimento espacial-visual do GPT-4V são insuficientes para um controle detalhado e preciso”. GPT4-V lutou com conceitos específicos de domínio, como ícones exclusivos no jogo, compreensão de minimapas e obstáculos gerais no ambiente de jogo.

Desempenho do CRADLE em diferentes tipos de missão / Fonte da imagem: arxiv.org

Embora o artigo publicado se concentre na interação da IA ​​com o RDR2, os autores afirmam que o objetivo do sistema CRADLE dentro do GCC é muito mais amplo: “suportar uma gama mais ampla de jogos, como jogos de simulação e estratégia, bem como vários aplicativos de software. ”

avalanche

Postagens recentes

Não se preocupe com a trilha sonora: o compositor de The Witcher 3 escreverá músicas para The Witcher 4.

O estúdio polonês CD Projekt Red não tem pressa em compartilhar detalhes sobre o aguardado…

1 hora atrás

A Microsoft restaurou o ícone de login por senha na tela de bloqueio do Windows 11, que havia desaparecido em agosto.

Seis meses depois, a Microsoft corrigiu um problema conhecido em que a opção de login…

4 horas atrás

Uma fonte interna decepcionou os fãs que esperavam ver Ada Wong e Chris Redfield em Resident Evil Requiem.

O lançamento do ambicioso jogo de terror Resident Evil Requiem marcará o grande retorno do…

8 horas atrás

O Samsung Galaxy S26 Ultra com caneta stylus aparece em imagem de pré-anúncio.

No final de janeiro, foi noticiado que os smartphones da série Samsung Galaxy S26 provavelmente…

10 horas atrás

“Vivo e bem”: Um analista de dados revelou o que está acontecendo com Half-Life 3.

O minerador de dados Maxim Poletaev (também conhecido como Gabe Follower) comentou recentemente sobre rumores…

11 horas atrás

A Ford manteve conversas com a Xiaomi sobre a produção de veículos elétricos nos EUA.

A Ford Motor, uma das maiores montadoras americanas, inicialmente se comprometeu com uma estreita cooperação…

12 horas atrás