Google lança Gemini 2.5 Deep Think, um modelo de IA de raciocínio que considera múltiplas ideias em paralelo

A divisão DeepMind do Google anunciou o lançamento do Gemini 2.5 Deep Think, o modelo de IA mais avançado da empresa, de acordo com seus desenvolvedores. Ele pode responder às perguntas dos usuários explorando e considerando várias opções simultaneamente, comparando os resultados e escolhendo a melhor. Os assinantes do Google Ultra, que custa US$ 250 por mês, terão acesso ao modelo de IA esta semana.

Fonte da imagem: Google

O Google anunciou o Gemini 2.5 Deep Think em sua conferência anual Google I/O em maio deste ano, afirmando que se tratava do primeiro modelo disponível publicamente da empresa que incorpora múltiplos agentes de IA. Essa abordagem permite que a rede neural utilize múltiplos agentes de IA para processar uma consulta em paralelo e gerar diferentes respostas possíveis para ela. Também requer significativamente mais recursos computacionais, mas o resultado final costuma ser significativamente melhor do que usar um sistema com um único agente de IA.

No mês passado, foi noticiado que o algoritmo Gemini 2.5 Deep Think alcançou resultados de nível medalha de ouro na Olimpíada Internacional de Matemática (IMO). Juntamente com o Gemini 2.5 Deep Think, os desenvolvedores disponibilizarão a versão do modelo de IA que competiu na IMO, mas apenas para um grupo seleto de matemáticos e cientistas. O Google espera que esse algoritmo melhore a eficiência da pesquisa, por isso a empresa está buscando feedback sobre como aprimorar o sistema multiagente para uso acadêmico.

O Google observou que o modelo Gemini 2.5 Deep Think AI foi significativamente melhorado em relação à versão anunciada em sua conferência I/O em maio, graças ao desenvolvimento de “novos métodos de aprendizado por reforço” que incentivam o algoritmo a usar suas capacidades lógicas de forma mais eficiente.

Segundo o Google, o novo modelo de IA teve um bom desempenho no Exame Final da Humanidade, um teste que faz milhares de perguntas acadêmicas simples e verificáveis em matemática, humanidades e ciências. Segundo o Google, a rede neural da empresa obteve 34,8% no teste, enquanto o Grok 4, da xAI, obteve apenas 25,4% e o o3, da OpenAI, 20,3%. O Google também afirma que o Gemini 2.5 Deep Think supera o OpenAI, o xAI e o Anthropic no LiveCodeBench6, um benchmark que testa problemas complexos de programação. Em uma série de testes, o modelo de IA do Google obteve 87,6%, enquanto o Grok 4 obteve 79% e o o3, 72%.

O Gemini 2.5 Deep Think implementa automaticamente os agentes de IA corretos, por exemplo, para escrever código ou pesquisar na web. De acordo com os desenvolvedores, a rede neural é capaz de produzir “respostas muito mais longas” em comparação com os modelos de IA tradicionais. O Google planeja disponibilizar o acesso ao Gemini 2.5 Deep Think a um grupo seleto de desenvolvedores por meio da API correspondente em um futuro próximo.

admin

Postagens recentes

Os astrônomos aprenderam a reconstruir as “biografias” das galáxias a partir de uma única fotografia.

Ao que tudo indica, um novo campo da arqueologia galáctica está emergindo na astronomia, permitindo-nos…

34 minutos atrás

A inteligência artificial tem demonstrado progresso na aprendizagem de línguas raras e pouco conhecidas.

Modelos de inteligência artificial em larga escala começaram a reduzir ativamente a lacuna linguística em…

34 minutos atrás

A Microsoft contornou as restrições do YouTube – o Edge para dispositivos móveis agora reproduz vídeos em segundo plano.

Em um esforço para expandir sua base de usuários pagantes, o YouTube está ativamente bloqueando…

34 minutos atrás

A Apple vence mais um processo contra a Masimo relacionado ao oxigênio no sangue.

A Apple obteve uma vitória significativa, embora não definitiva, em sua longa batalha judicial com…

3 horas atrás

Uma startup da Califórnia desenvolveu um boné capaz de ler mentes sem “buracos no crânio”.

Para muitas pessoas, a implantação de microchips é um "histórico de terror", mas em alguns…

4 horas atrás