O Google atualizou seu ranking do Android Bench e os resultados revelaram um cenário intrigante: o novo modelo Gemini 3.5 Flash AI apresenta desempenho inferior ao seu antecessor em termos de qualidade do código escrito para aplicativos Android e cobra três vezes mais pelo mesmo serviço.
Fonte da imagem: blog.google
O novo modelo Google Gemini 3.5 Flash acaba de entrar neste ranking e nem sequer ficou entre os cinco primeiros. O OpenAI GPT 5.5 conquistou o primeiro lugar com 74 pontos, enquanto o GPT 5.4 e o Google Gemini 3.1 Pro Preview empataram em segundo e terceiro lugar, respectivamente, com 72,4 pontos. A variante Flash também obteve uma pontuação inferior à dos novos modelos Anthropic Claude Opus.
O Google Gemini 3.5 Flash alcançou 63,7 pontos, ficando em sexto lugar na classificação geral. Seu desempenho foi uma decepção: a média de tokens foi de 355,9, significativamente maior do que a de outros sistemas. Com um preço médio de US$ 147,1, é o modelo mais caro da lista e também oferece o pior desempenho em comparação com seus concorrentes.
Fonte da imagem: developer.android.com
Esses números são surpreendentes, visto que os modelos da série Flash do Google são tradicionalmente conhecidos por sua alta velocidade e baixo preço. Ao apresentar o Gemini 3.5 Flash, a empresa afirmou que ele gera código de alta qualidade e oferece suporte eficaz ao gerenciamento de agentes de IA e fluxos de trabalho complexos; em diversos testes, ele superou até mesmo o Gemini 3.1 Pro.
Mas o Android Bench sugere o contrário. A questão é se o Google conseguirá melhorar a qualidade do Gemini 3.5 Flash ou se o futuro Gemini 3.5 Pro corresponderá melhor às promessas da empresa. Por ora, os próprios números do Google demonstram que o novo nem sempre é melhor.
Mais de três anos e meio após o lançamento do ChatGPT, assistentes de IA são…
A Logitech atualizou seu popular mouse gamer G305 com o G305 X Superlight. O mouse…
A Noctua anunciou o lançamento do seu primeiro sistema de refrigeração líquida, o NL-LC1. Ele…
Quando o entusiasta de tecnologia retrô Christian Simpson assumiu a liderança dos remanescentes da lendária…
Este ano, os desenvolvedores do WhatsApp começaram a testar chamadas de voz e vídeo na…
O FBI, o Google e a Lumen Technologies anunciaram a desarticulação da Outsider Enterprise, um…