O Google apresentou um protótipo de pesquisa de um agente de IA chamado Project Mariner, que é capaz de realizar ações na Internet para uma pessoa. A divisão do Google, DeepMind, é responsável pelo desenvolvimento. O agente de IA baseado em Gemini assume o controle do navegador Chrome, move o cursor na tela, clica em botões e preenche formulários, permitindo usar e navegar em sites como um ser humano faria.
A empresa disse que o Project Mariner está atualmente em testes com um grupo de usuários pré-selecionados. Em conversa com o TechCrunch, a diretora do Google Labs, Jaclyn Konzelmann, disse que o Project Mariner representa uma abordagem fundamentalmente nova para a interface do usuário. O projeto propõe abandonar a interação direta do usuário com os sites, confiando essas tarefas a um sistema generativo de IA. Tais mudanças poderão afectar milhões de empresas – desde a publicação na Internet até ao retalho – que tradicionalmente dependem do Google como ponto de partida para atrair utilizadores para os seus websites, disse ela.
Após instalar e configurar o Project Mariner como extensão do navegador Chrome, este terá uma janela de chat especial. Nele, você pode atribuir um agente de IA para executar diversas tarefas. Por exemplo, ele poderia ser solicitado a criar um carrinho de compras em um supermercado com base em uma determinada lista. Depois disso, o agente AI irá de forma independente até a página da loja especificada (a loja Safeway foi usada na demonstração), procurará os produtos necessários e os adicionará ao carrinho. Os jornalistas observam que o sistema não funciona tão rapidamente quanto gostaríamos: passam aproximadamente 5 segundos entre cada movimento do cursor. Às vezes, o agente de IA interrompe a tarefa e retorna à janela de chat, pedindo esclarecimentos, por exemplo, sobre o peso ou quantidade da mercadoria.
O agente de IA do Google não pode fazer um pedido porque seu algoritmo não inclui funções para preencher números de cartão de crédito e outras informações de pagamento. O Project Mariner também não aceita cookies nem assina termos de uso em nome dos usuários. O Google enfatiza que isso é intencional para dar mais controle aos usuários.
Além disso, o agente de IA faz capturas de tela da janela do navegador, com as quais os usuários devem concordar antes de usá-lo. Essas imagens são enviadas ao serviço de nuvem Gemini para processamento, que então envia instruções de volta ao dispositivo do usuário para navegar na página da web. O Project Mariner pode ser usado para pesquisar voos e hotéis, comprar utensílios domésticos, encontrar receitas e outras tarefas que agora exigem a navegação em sites por conta própria.
Uma das principais limitações do Project Mariner é que ele só funciona na guia ativa do navegador Chrome. Em outras palavras, a página web em que o agente de IA atua deve estar constantemente aberta na tela do monitor. Os usuários terão que observar cada movimento do bot. De acordo com Koray Kavukcuoglu, diretor de tecnologia do Google DeepMind, isso é feito especificamente para que os usuários saibam exatamente o que o agente de IA está fazendo.
«Como [Gemini] agora está realizando ações em nome do usuário, é importante fazer isso passo a passo. Este é um recurso adicional. Você, como indivíduo, pode usar sites, e agora seu agente pode fazer tudo o que você faz no site”, disse Kavukcuoglu em entrevista ao TechCrunch.
Por um lado, os usuários ainda terão que ver a página do site, o que é benéfico para os proprietários dos recursos. No entanto, a utilização do Project Mariner reduz o nível de interacção directa do utilizador com as funções do site e pode eventualmente eliminar a necessidade de visitar websites de forma independente.
«O Project Mariner é uma mudança de paradigma fundamentalmente nova em UX que estamos vendo agora. Precisamos descobrir como configurar isso corretamente para mudar a forma como os usuários interagem com a Internet e também encontrar maneiras para os editores criarem suas próprias soluções para usuários baseadas em agentes de IA no futuro”, acrescentou Conzelmann.
Além do Projeto Mariner, o Google introduziu vários outros agentes de IA para tarefas especializadas. Por exemplo, a ferramenta Deep Research para pesquisas profundas e pesquisas na Internet. Também foi apresentado o agente Jules AI, projetado para ajudar os desenvolvedores a escrever código. Ele se integra aos fluxos de trabalho do GitHub, analisa o estado atual de desenvolvimento e pode fazer alterações diretamente nos repositórios. Jules está em testes e estará disponível em 2025.
O Google DeepMind também está desenvolvendo um agente de IA para ajudar os usuários a jogar videogames. Para fazer isso, a empresa está fazendo parceria com a desenvolvedora de jogos Supercell para testar a capacidade do Gemini de interpretar mundos de jogos usando Clash of Clans como exemplo. O momento para o lançamento do protótipo deste agente de IA ainda não é conhecido, mas o Google enfatiza que este desenvolvimento ajudará a criar agentes de IA para navegação em mundos reais e virtuais.