O Google introduziu um recurso de automação baseado em agentes para o Gemini nos smartphones Pixel 10 e Samsung Galaxy S26. O agente de IA poderá abrir aplicativos de forma autônoma, fazer pedidos em lojas e muito mais, substituindo as ações do usuário.

Fonte da imagem: Google
A rede neural será capaz de fazer mais do que simplesmente buscar informações; ela também executará ações específicas em aplicativos de terceiros. Se você pedir ao sistema para chamar um táxi, o Gemini abrirá automaticamente o Uber ou o DoorDash em uma janela virtual e começará a fazer o pedido. De acordo com o The Verge, o usuário pode observar a IA navegar pelas opções do menu e pode interromper o processo a qualquer momento ou simplesmente minimizar a janela para continuar a tarefa em segundo plano.
O sistema foi projetado para que a decisão final sobre o pedido e o pagamento seja do usuário: o Gemini enviará uma notificação solicitando que ele revise o pedido e confirme o pagamento. Se houver algum atraso no processo, por exemplo, se o item desejado estiver fora de estoque ou se for necessário selecionar uma opção de personalização, a IA também o notificará.
A implementação técnica é baseada no modelo de raciocínio Gemini 3, que consegue interpretar visualmente a interface. O Google oferece aos desenvolvedores de aplicativos uma variedade de protocolos especializados, como MCP ou Funções de Aplicativos Android, mas o sistema pode funcionar sem eles, simplesmente analisando a imagem na tela e clicando em botões, como um humano faria.
De acordo com Sameer Samat, presidente do ecossistema Android, o usuário não se importa com a tecnologia usada para alcançar essa automação, desde que a tarefa seja concluída. Isso, como observa o The Verge, levanta a questão de se os desenvolvedores de aplicativos podem ficar incomodados com a possibilidade de perderem a capacidade de exibir anúncios de seus serviços aos usuários. Ao comentar sobre essa situação, um representante do Google observou que o desenvolvimento da tecnologiaInevitável, e agora a comunidade de desenvolvedores enfrentará o desafio de encontrar as melhores maneiras de interagir com isso. Há relatos de que os recursos de agentes serão profundamente integrados às versões futuras da plataforma, particularmente ao Android 17.