A startup chinesa DeepSeek apresentou um novo modelo de IA, o DeepseekMath-V2, que demonstra resultados impressionantes na resolução de problemas matemáticos complexos. O algoritmo concluiu com sucesso diversas tarefas da Olimpíada Internacional de Matemática (IMO 2025) e da Olimpíada Chinesa de Matemática (CMO 2024), alcançando resultados dignos de medalha de ouro.
Fonte da imagem: the-decoder.com
O anúncio afirma que o DeepseekMath-V2 obteve 118 de 120 pontos nos problemas de Putnam, uma pontuação significativamente superior à melhor pontuação humana, de 90. A DeepSeek observa que, anteriormente, os modelos de IA frequentemente produziam respostas corretas para problemas matemáticos complexos, mas não mostravam os passos corretos da solução. Para solucionar isso, o modelo de IA utiliza um processo de múltiplas etapas com um verificador separado para avaliar a correção dos passos de resolução do problema e a necessidade de revisá-los. Essa estrutura permite que o algoritmo verifique e aprimore suas soluções em tempo real.
Tecnicamente, o DeepseekMath-V2 é construído sobre o modelo base Deepseek-V3.2-Exp-Base. A descrição do DeepSeek nunca menciona o uso de ferramentas externas, como calculadoras ou interpretadores de código. Em experimentos importantes, o mesmo modelo DeepseekMath-V2 é usado tanto para a geração quanto para a verificação de provas. O alto desempenho do algoritmo decorre de sua capacidade de analisar e aprimorar suas próprias conclusões sem depender de software externo. Para resolver problemas mais complexos, o modelo aumenta seu poder computacional durante a fase de teste, gerando e verificando múltiplas provas possíveis em paralelo para aumentar a confiança na resposta final.
O lançamento do DeepSeek ocorre após o anúncio de modelos de IA ainda não lançados da OpenAI e do Google DeepMind, que alcançaram resultados semelhantes na resolução de problemas matemáticos complexos. Notavelmente, esses algoritmos obtiveram esse resultado por meio da capacidade de raciocínio, e não por meio de otimização direcionada para competições matemáticas. Se o sucesso desses algoritmos for realmente tão impressionante, isso significaria que os modelos de linguagem estão se aproximando do ponto em que podem resolver problemas complexos e abstratos, tradicionalmente considerados uma habilidade puramente humana.
Vale ressaltar que a decisão do DeepSeek de divulgar os detalhes técnicos de seu modelo DeepseekMath-V2 contrasta fortemente com o sigilo mantido pelo Google e pela OpenAI. Enquanto as empresas americanas mantêm em segredo os detalhes da arquitetura de seus modelos de IA, a startup chinesa está revelando tudo, demonstrando claramente que a empresa está em pé de igualdade com os líderes do setor.
Processador Intel ou AMD quad-core rodando a 2,5 GHz, 8 GB de RAM, placa de…
Antes do lançamento iminente do Acesso Antecipado, os desenvolvedores do estúdio cipriota com raízes russas,…
A Owlcat Games, um estúdio cipriota com raízes russas, lançou um novo teaser para The…
O portal americano Grid Status inadvertidamente divulgou informações sobre o início das operações do maior…
A Anthropic anunciou o lançamento do Claude Design, uma nova ferramenta experimental de design visual…
Startups europeias que desenvolvem alternativas às GPUs da Nvidia buscam escalar seus negócios em meio…