Categorias: Aplicativos Android

O Google nomeia os melhores modelos de IA para desenvolvimento de aplicativos Android – Gemini perde para GPT.

O Google atualizou mais uma vez seu ranking Android Bench, que reúne os melhores modelos de IA para desenvolvimento de aplicativos Android. A lista agora inclui muitos modelos de código aberto e fornece informações detalhadas sobre os tokens utilizados e o custo de execução desses modelos.

Fonte da imagem: developer.android.com

Uma área em que os grandes modelos de linguagem realmente se destacaram foi na programação, com sua capacidade de auxiliar no desenvolvimento de aplicativos e outros projetos de software. O Google Gemini 3.1 Pro foi o primeiro líder do Android Bench, e o OpenAI GPT 5.4 empatou com ele posteriormente. Em 18 de maio, o GPT 5.5 assumiu a liderança, superando o Gemini 3.1 Pro e o GPT 5.4 em quase 2%.

Os resultados do benchmark se tornaram mais transparentes, já que o Google forneceu alguns detalhes. O ranking agora inclui a latência média — o tempo necessário para resolver 100 problemas em 10 execuções; o consumo médio total de tokens — o consumo de tokens por execução ao longo das 10 execuções; e o custo médio — o custo de executar um benchmark em dólares americanos.

Isso nos ajudou a entender que, embora o GPT 5.5 seja um pouco mais poderoso, executar as mesmas tarefas no Gemini 3.1 Pro custa menos da metade. Dos modelos de código aberto, o GLM 5.1 teve o melhor desempenho. O Google lançou recentemente o poderoso Gemini 3.5 Flash, e o ainda mais poderoso Gemini 3.5 Pro será lançado em breve — será interessante ver como eles se comparam ao líder atual da OpenAI, o GPT 5.5.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A corretora de criptomoedas Coinbase permitiu que agentes de IA participassem de negociações e análises.

A corretora de criptomoedas Coinbase apresentou uma ferramenta que permite que agentes de IA executem…

1 hora atrás

Para que servem realmente os computadores quânticos? / Offsyanka

Os computadores quânticos ainda são um conceito um tanto exótico nos dias de hoje, embora…

2 horas atrás

Uma demo do jogo de terror retrofuturista RetroSpace, inspirado em System Shock, vazou no Steam.

O estúdio húngaro The Wild Gentlemen, com o apoio da editora Kwalee, anunciou o lançamento…

3 horas atrás

A Gigabyte apresentou a placa-mãe B840M Force WIFI6E, de baixo custo, com overclocking para DDR5 e otimizações para Ryzen X3D.

A Gigabyte lançou a placa-mãe B840M Force WIFI6E Micro-ATX para processadores Ryzen 9000, Ryzen 8000…

4 horas atrás

O RPG de ação Valor Mortis, dos criadores de Ghostrunner, não será lançado no mesmo dia que Control Resonant – uma nova data de lançamento foi anunciada.

A editora Lyrical Games e os desenvolvedores do estúdio polonês One More Level (duologia Ghostrunner)…

6 horas atrás