O Google lançou um novo modelo de IA projetado para oferecer alto desempenho com foco na eficiência. Ele se chama Gemini 2.5 Flash e em breve estará disponível como parte da plataforma Vertex AI do Google Cloud para implantação e gerenciamento de modelos de inteligência artificial (IA).

Fonte da imagem: Google

A empresa observa que o Gemini 2.5 Flash oferece computação “dinâmica e controlada”, permitindo que os desenvolvedores ajustem o tempo de processamento das solicitações com base na complexidade delas.

«Você pode personalizar a velocidade, a precisão e o equilíbrio de custos para atender às suas necessidades específicas. Essa flexibilidade é essencial para otimizar o desempenho do Flash em aplicativos de alta carga e com alto custo”, escreveu a empresa em seu blog oficial.

Com o aumento do custo de execução dos principais modelos de IA, o Gemini 2.5 Flash pode ser extremamente útil. Modelos mais baratos e potentes, como o 2.5 Flash, são uma alternativa atraente às opções caras dos carros-chefes, mas ao custo de perder um pouco de precisão.

O Gemini 2.5 Flash é um modelo de “raciocínio” semelhante ao o3-mini da OpenAI e ao R1 da DeepSeek. Isso significa que ela demora um pouco mais para verificar os fatos e responder às perguntas. O Google diz que o Flash 2.5 é ideal para trabalhar com grandes quantidades de dados e para uso em tempo real, especialmente para tarefas como atendimento ao cliente e análise de documentos.

«Este modelo de trabalho é otimizado especificamente para baixa latência e baixos custos. “É um mecanismo ideal para assistentes virtuais responsivos e ferramentas de resumo em tempo real, onde a eficiência em escala é fundamental”, descreve a empresa sobre o novo modelo de IA.

O Google não publicou um relatório de segurança ou especificações técnicas para o Gemini 2.5 Flash, o que dificulta determinar seus pontos fortes e fracos. A empresa disse anteriormente que não publica relatórios para modelos que considera experimentais.

O Google também anunciou que planeja integrar modelos Gemini, como o 2.5 Flash, em ambientes locais a partir do terceiro trimestre. Eles estarão disponíveis no Google Distributed Cloud (GDC), a solução local do Google para clientes com requisitos rigorosos de governança de dados. A empresa acrescentou que está trabalhando com a Nvidia para implementar o Gemini em sistemas Nvidia Blackwell compatíveis com GDC, que os clientes podem comprar pelo Google ou por seus próprios canais.

avalanche

Postagens recentes

A viagem foi adiada: o simulador de viagens em trailer Outbound não será lançado em 23 de abril.

Os desenvolvedores do estúdio holandês Square Glade Games (Above Snakes) anunciaram o adiamento forçado do…

38 minutos atrás

A Keychron apresentou o G3, um mouse gamer sem fio de 44g com hardware de ponta.

A Keychron é conhecida principalmente por seus teclados mecânicos, mas recentemente ganhou destaque no segmento…

54 minutos atrás

“Vou dedicar toda a minha paixão, energia e alma a isso”: o filme de animação de Bloodborne está em boas mãos.

A blogueira irlandesa Sean McLoughlin, mais conhecida pelo pseudônimo Jacksepticeye, comentou o anúncio de um…

1 hora atrás

Os analistas estão confiantes de que a Apple não aumentará os preços dos Macs para atrair usuários de PCs.

Analistas acreditam que a Apple pode estar adotando uma política bastante atípica em busca de…

1 hora atrás

O Snap anunciou que irá cortar 1.000 empregos devido a “avanços na IA”.

As ações da Snap subiram quase 7% após o anúncio de planos para demitir aproximadamente…

2 horas atrás

O robô chinês Unitree R1 já está disponível no AliExpress com entrega internacional — custa apenas US$ 8.150.

Hoje, a empresa chinesa Unitree Robotics lançou seu robô humanoide mais barato no AliExpress, com…

2 horas atrás