O Google revelou um modelo Gemini que preenche formulários em um navegador e joga 2048.

O Google revelou uma prévia do seu novo modelo de IA Gemini 2.5, que conta com um recurso de uso do computador que permite interagir com sites por meio de um navegador, imitando interações humanas. O modelo utiliza compreensão visual e raciocínio lógico para realizar tarefas como preencher e enviar formulários sem o uso de uma API ou outra interface de programação.

Fonte da imagem: Solen Feyissa/Unsplash

De acordo com o The Verge, o modelo Gemini 2.5 Computer Use foi projetado para interfaces de usuário projetadas para humanos, não para sistemas automatizados. O Google afirma que a tecnologia já foi utilizada em seus recursos de agente do Modo IA e no protótipo de pesquisa do Projeto Mariner, onde agentes de IA executavam tarefas de forma autônoma em um navegador, como adicionar itens a um carrinho de compras com base em uma lista de ingredientes.

Curiosamente, o anúncio do novo modelo ocorreu um dia após a OpenAI revelar novas aplicações para o ChatGPT em seu evento anual Dev Day, dando continuidade ao desenvolvimento do recurso ChatGPT Agent, que pode executar tarefas complexas em nome do usuário. Enquanto isso, a Anthropic lançou uma versão do modelo Claude com o Computer Use no ano passado. No entanto, o Google afirma que seu modelo “supera concorrentes líderes em diversos benchmarks da web e mobile”.

Ao contrário do ChatGPT Agent e da Anthropic, o Gemini 2.5 Computer Use acessa apenas o navegador, não todo o sistema operacional. O Google enfatizou que a solução “ainda não está otimizada para controle em nível de desktop” e suporta 13 ações, incluindo abrir um navegador da web, inserir texto e arrastar e soltar elementos.

O modelo já está disponível para desenvolvedores por meio das plataformas Google AI Studio e Vertex AI. Além disso, uma demonstração pública está disponível no navegador virtual BrowserBase, onde você pode assistir a IA executar tarefas como “jogar 2048” ou “navegar no Hacker News para ver os tópicos mais populares”.

admin

Postagens recentes

As autoridades americanas propuseram que os desenvolvedores de IA criem padrões uniformes para os modelos.

O governo dos EUA está negociando ativamente com empresas que desenvolvem sistemas de inteligência artificial,…

1 hora atrás

O Ministério da Justiça do Brasil desclassificou a sequência da lendária série da Nintendo.

Quase cinco anos se passaram desde o lançamento de Metroid Dread, o jogo favorito dos…

2 horas atrás

A União Europeia poderá proibir o uso de redes sociais por crianças já em setembro.

A União Europeia poderá anunciar uma proibição do acesso de crianças às redes sociais em…

2 horas atrás

A rede social X pretende aumentar a popularidade das transmissões ao vivo na plataforma.

A rede social X destinou US$ 1 milhão para incentivar criadores de conteúdo a transmitirem…

3 horas atrás

Os demandantes adotaram a IA e estão mantendo os tribunais do Reino Unido ocupados até 2028.

Segundo o Financial Times, a introdução da inteligência artificial generativa afetou diretamente o sistema judicial…

3 horas atrás