Google lança Gemini 2.5 Deep Think, um modelo de IA de raciocínio que considera múltiplas ideias em paralelo

A divisão DeepMind do Google anunciou o lançamento do Gemini 2.5 Deep Think, o modelo de IA mais avançado da empresa, de acordo com seus desenvolvedores. Ele pode responder às perguntas dos usuários explorando e considerando várias opções simultaneamente, comparando os resultados e escolhendo a melhor. Os assinantes do Google Ultra, que custa US$ 250 por mês, terão acesso ao modelo de IA esta semana.

Fonte da imagem: Google

O Google anunciou o Gemini 2.5 Deep Think em sua conferência anual Google I/O em maio deste ano, afirmando que se tratava do primeiro modelo disponível publicamente da empresa que incorpora múltiplos agentes de IA. Essa abordagem permite que a rede neural utilize múltiplos agentes de IA para processar uma consulta em paralelo e gerar diferentes respostas possíveis para ela. Também requer significativamente mais recursos computacionais, mas o resultado final costuma ser significativamente melhor do que usar um sistema com um único agente de IA.

No mês passado, foi noticiado que o algoritmo Gemini 2.5 Deep Think alcançou resultados de nível medalha de ouro na Olimpíada Internacional de Matemática (IMO). Juntamente com o Gemini 2.5 Deep Think, os desenvolvedores disponibilizarão a versão do modelo de IA que competiu na IMO, mas apenas para um grupo seleto de matemáticos e cientistas. O Google espera que esse algoritmo melhore a eficiência da pesquisa, por isso a empresa está buscando feedback sobre como aprimorar o sistema multiagente para uso acadêmico.

O Google observou que o modelo Gemini 2.5 Deep Think AI foi significativamente melhorado em relação à versão anunciada em sua conferência I/O em maio, graças ao desenvolvimento de “novos métodos de aprendizado por reforço” que incentivam o algoritmo a usar suas capacidades lógicas de forma mais eficiente.

Segundo o Google, o novo modelo de IA teve um bom desempenho no Exame Final da Humanidade, um teste que faz milhares de perguntas acadêmicas simples e verificáveis em matemática, humanidades e ciências. Segundo o Google, a rede neural da empresa obteve 34,8% no teste, enquanto o Grok 4, da xAI, obteve apenas 25,4% e o o3, da OpenAI, 20,3%. O Google também afirma que o Gemini 2.5 Deep Think supera o OpenAI, o xAI e o Anthropic no LiveCodeBench6, um benchmark que testa problemas complexos de programação. Em uma série de testes, o modelo de IA do Google obteve 87,6%, enquanto o Grok 4 obteve 79% e o o3, 72%.

O Gemini 2.5 Deep Think implementa automaticamente os agentes de IA corretos, por exemplo, para escrever código ou pesquisar na web. De acordo com os desenvolvedores, a rede neural é capaz de produzir “respostas muito mais longas” em comparação com os modelos de IA tradicionais. O Google planeja disponibilizar o acesso ao Gemini 2.5 Deep Think a um grupo seleto de desenvolvedores por meio da API correspondente em um futuro próximo.

admin

Postagens recentes

Os elogios de Trump ao CEO da Intel fizeram com que as ações da empresa disparassem 10%.

No ano passado, ocorreu um precedente interessante: o governo dos EUA adquiriu efetivamente quase 10%…

3 horas atrás

Elon Musk prometeu divulgar o código-fonte do novo algoritmo X em sete dias.

O negócio de software do bilionário americano Elon Musk está enfrentando desafios em termos de…

4 horas atrás

A Nvidia respondeu rapidamente à onda de críticas após o lançamento do DGX Spark.

O "supercomputador de mesa" DGX Spark, apresentado no final do ano passado, atraiu críticas consideráveis…

5 horas atrás

O Japão está enfrentando uma escassez de placas de vídeo, com o problema afetando atualmente os modelos GeForce RTX 5060 Ti de 16 GB e superiores.

Segundo a ITmedia, surgiu uma escassez de aceleradores gráficos de alta gama no mercado japonês.…

12 horas atrás

O Instagram vazou dados de 17,5 milhões de contas, e esses dados já estão sendo usados ​​por hackers.

A empresa de software de cibersegurança Malwarebytes anunciou uma violação de dados confirmada que afetou…

13 horas atrás