Categorias: Aplicativos Android

O Google nomeia os melhores modelos de IA para desenvolvimento de aplicativos Android – Gemini perde para GPT.

O Google atualizou mais uma vez seu ranking Android Bench, que reúne os melhores modelos de IA para desenvolvimento de aplicativos Android. A lista agora inclui muitos modelos de código aberto e fornece informações detalhadas sobre os tokens utilizados e o custo de execução desses modelos.

Fonte da imagem: developer.android.com

Uma área em que os grandes modelos de linguagem realmente se destacaram foi na programação, com sua capacidade de auxiliar no desenvolvimento de aplicativos e outros projetos de software. O Google Gemini 3.1 Pro foi o primeiro líder do Android Bench, e o OpenAI GPT 5.4 empatou com ele posteriormente. Em 18 de maio, o GPT 5.5 assumiu a liderança, superando o Gemini 3.1 Pro e o GPT 5.4 em quase 2%.

Os resultados do benchmark se tornaram mais transparentes, já que o Google forneceu alguns detalhes. O ranking agora inclui a latência média — o tempo necessário para resolver 100 problemas em 10 execuções; o consumo médio total de tokens — o consumo de tokens por execução ao longo das 10 execuções; e o custo médio — o custo de executar um benchmark em dólares americanos.

Isso nos ajudou a entender que, embora o GPT 5.5 seja um pouco mais poderoso, executar as mesmas tarefas no Gemini 3.1 Pro custa menos da metade. Dos modelos de código aberto, o GLM 5.1 teve o melhor desempenho. O Google lançou recentemente o poderoso Gemini 3.5 Flash, e o ainda mais poderoso Gemini 3.5 Pro será lançado em breve — será interessante ver como eles se comparam ao líder atual da OpenAI, o GPT 5.5.

admin

Próximo "Deixem-no terminar o trabalho dele": Anthropic pediu aos desenvolvedores que não interferissem no trabalho de Claude, que estava escrevendo e revisando o código. »

Anterior « A Realme apresentou o smartwatch Watch S5 com tela AMOLED de 1,43 polegadas e bateria com duração de até 20 dias, por US$ 80.

Deixar comentário

Publicado por

admin

1 mês atrás

Postagens recentes

Notícias da rede

A rede social X pretende aumentar a popularidade das transmissões ao vivo na plataforma.

A rede social X destinou US$ 1 milhão para incentivar criadores de conteúdo a transmitirem…

29 minutos atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Os demandantes adotaram a IA e estão mantendo os tribunais do Reino Unido ocupados até 2028.

Segundo o Financial Times, a introdução da inteligência artificial generativa afetou diretamente o sistema judicial…

29 minutos atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

Inteligência artificial e deepfakes são usados em um em cada oito golpes bem-sucedidos.

Golpistas, que causaram prejuízos de US$ 68 bilhões a cidadãos somente nos EUA no ano…

29 minutos atrás

Na vanguarda da ciência

A China testou elementos de uma catapulta eletromagnética para lançar foguetes ao espaço. Os lançamentos estão planejados para ocorrer nos picos das montanhas do Tibete.

Os engenheiros chineses não abandonaram a ideia de um "lançamento elétrico" para foguetes — fornecendo…

29 minutos atrás

Notícias e análises financeiras

A SK Hynix e a Samsung anunciaram investimentos bilionários em fábricas de memória na Coreia.

A SK Hynix anunciou sua intenção de investir 100 trilhões de won (mais de US$…

30 minutos atrás

Jogos

Novo bioma, naves e vento: a primeira grande atualização de Windrose recebe detalhes e um teaser de jogabilidade.

O estúdio uzbeque Kraken Express divulgou detalhes da primeira grande atualização de conteúdo para o…

2 horas atrás

O Google nomeia os melhores modelos de IA para desenvolvimento de aplicativos Android – Gemini perde para GPT.

Postagens recentes

A rede social X pretende aumentar a popularidade das transmissões ao vivo na plataforma.

Os demandantes adotaram a IA e estão mantendo os tribunais do Reino Unido ocupados até 2028.

Inteligência artificial e deepfakes são usados ​​em um em cada oito golpes bem-sucedidos.

A China testou elementos de uma catapulta eletromagnética para lançar foguetes ao espaço. Os lançamentos estão planejados para ocorrer nos picos das montanhas do Tibete.

A SK Hynix e a Samsung anunciaram investimentos bilionários em fábricas de memória na Coreia.

Novo bioma, naves e vento: a primeira grande atualização de Windrose recebe detalhes e um teaser de jogabilidade.

Inteligência artificial e deepfakes são usados em um em cada oito golpes bem-sucedidos.