Um grupo de pesquisadores da China e Cingapura ensinou IA baseada em OpenAI GPT-4V para jogar Red Dead Redemption 2 (RDR2). Em seu artigo, eles falaram sobre o conceito de General Computer Control (GCC) para IA e sobre o agente multimodal CRADLE – uma interface entre GPT-4V e RDR2. Na opinião deles, os principais problemas com o agente de IA do jogo surgiram ao usar a visão computacional.
O objetivo dos pesquisadores era fazer com que a IA, alimentada por OpenAI GPT-4V, interagisse com um computador detectando sinais visuais e de áudio, assim como faz o usuário humano médio de PC. O projeto fornece informações sobre o quão longe os desenvolvedores de IA avançaram no movimento em direção à inteligência artificial geral (AGI).
Os pesquisadores escolheram o RDR2 porque possui “um sofisticado sistema de controle de caixa preta que incorpora as tarefas de computação mais exigentes e nos permite avaliar os limites de desempenho de nossa plataforma em tais ambientes virtuais”. Além disso, elementos da interface do usuário, como diálogos, ícones exclusivos, dicas e instruções no jogo, garantem que nenhum conhecimento básico seja considerado garantido, o que é ótimo para o treinamento de IA. Os pesquisadores afirmam que controlar o jogo usando mouse e teclado fornece o melhor treinamento para o GCC.
Os pesquisadores pretendiam demonstrar a capacidade da IA de aprender um jogo do zero (sem acesso a qualquer estado interno do jogo ou API), da mesma forma que um ser humano faria. O agente de IA “jogou” o jogo, movendo-se pelo mundo e completando missões, seguindo o enredo principal de RDR2. No geral, o CRADLE foi um sucesso notável no RDR2. Ele foi capaz de “completar consistentemente todos os objetivos principais do enredo”, com exceção da missão Firestorm, missões que exigem a exploração de um mundo interior complexo e missões abertas de vários estágios.
Os pesquisadores acreditam que o GPT4-V é responsável por algumas das dificuldades recorrentes que o CRADLE encontrou. Na sua opinião, “as capacidades de reconhecimento espacial-visual do GPT-4V são insuficientes para um controle detalhado e preciso”. GPT4-V lutou com conceitos específicos de domínio, como ícones exclusivos no jogo, compreensão de minimapas e obstáculos gerais no ambiente de jogo.
Embora o artigo publicado se concentre na interação da IA com o RDR2, os autores afirmam que o objetivo do sistema CRADLE dentro do GCC é muito mais amplo: “suportar uma gama mais ampla de jogos, como jogos de simulação e estratégia, bem como vários aplicativos de software. ”
Em 28 de dezembro, a Diretiva da UE 2022/2380 sobre o uso de um único…
A Internet está cheia de vídeos de uvas literalmente pegando fogo no micro-ondas. Quando o…
A nona empresa de telecomunicações dos Estados Unidos teve os seus recursos atacados no âmbito…
É comum que as pessoas modernas se preocupem com o roubo dos seus dados pessoais…
As pulseiras para smartwatches e rastreadores de fitness de marcas populares contêm altas concentrações de…
Durante uma reunião com funcionários na semana passada, o CEO do Google, Sundar Pichai, disse…