O Google lançou um novo modelo de IA projetado para oferecer alto desempenho com foco na eficiência. Ele se chama Gemini 2.5 Flash e em breve estará disponível como parte da plataforma Vertex AI do Google Cloud para implantação e gerenciamento de modelos de inteligência artificial (IA).

Fonte da imagem: Google

A empresa observa que o Gemini 2.5 Flash oferece computação “dinâmica e controlada”, permitindo que os desenvolvedores ajustem o tempo de processamento das solicitações com base na complexidade delas.

«Você pode personalizar a velocidade, a precisão e o equilíbrio de custos para atender às suas necessidades específicas. Essa flexibilidade é essencial para otimizar o desempenho do Flash em aplicativos de alta carga e com alto custo”, escreveu a empresa em seu blog oficial.

Com o aumento do custo de execução dos principais modelos de IA, o Gemini 2.5 Flash pode ser extremamente útil. Modelos mais baratos e potentes, como o 2.5 Flash, são uma alternativa atraente às opções caras dos carros-chefes, mas ao custo de perder um pouco de precisão.

O Gemini 2.5 Flash é um modelo de “raciocínio” semelhante ao o3-mini da OpenAI e ao R1 da DeepSeek. Isso significa que ela demora um pouco mais para verificar os fatos e responder às perguntas. O Google diz que o Flash 2.5 é ideal para trabalhar com grandes quantidades de dados e para uso em tempo real, especialmente para tarefas como atendimento ao cliente e análise de documentos.

«Este modelo de trabalho é otimizado especificamente para baixa latência e baixos custos. “É um mecanismo ideal para assistentes virtuais responsivos e ferramentas de resumo em tempo real, onde a eficiência em escala é fundamental”, descreve a empresa sobre o novo modelo de IA.

O Google não publicou um relatório de segurança ou especificações técnicas para o Gemini 2.5 Flash, o que dificulta determinar seus pontos fortes e fracos. A empresa disse anteriormente que não publica relatórios para modelos que considera experimentais.

O Google também anunciou que planeja integrar modelos Gemini, como o 2.5 Flash, em ambientes locais a partir do terceiro trimestre. Eles estarão disponíveis no Google Distributed Cloud (GDC), a solução local do Google para clientes com requisitos rigorosos de governança de dados. A empresa acrescentou que está trabalhando com a Nvidia para implementar o Gemini em sistemas Nvidia Blackwell compatíveis com GDC, que os clientes podem comprar pelo Google ou por seus próprios canais.

avalanche

Postagens recentes

As profissões de engenharia provaram ser as mais resilientes na era da IA.

A forma como o mercado de trabalho se transformará na era da inteligência artificial continua…

39 minutos atrás

O Google continua a perder talentos em IA com a chegada de mais dois pesquisadores à Anthropic.

O Google continua a perder funcionários valiosos, e isso já está causando preocupação entre os…

52 minutos atrás

A Apple aumentou os preços de todos os Macs e iPads em US$ 100 a US$ 1.300 — pelo mesmo motivo que todos os outros.

A Apple finalmente tomou medidas extremas e anunciou aumentos de preços em computadores Mac, tablets…

52 minutos atrás

A IBM apresentou a primeira tecnologia de processo de 0,7 nanômetros e a arquitetura de transistor nanostack 3D.

A IBM apresentou a primeira tecnologia de fabricação de chips de silício subnanométricos do setor,…

2 horas atrás

Um engenheiro da AMD usou uma impressora 3D para construir sua própria Steam Machine com uma RTX 5060.

A Valve anunciou anteriormente que "qualquer pessoa" poderia construir sua própria "Steam Machine", já que…

2 horas atrás