A startup chinesa DeepSeek apresentou um novo modelo de IA, o DeepseekMath-V2, que demonstra resultados impressionantes na resolução de problemas matemáticos complexos. O algoritmo concluiu com sucesso diversas tarefas da Olimpíada Internacional de Matemática (IMO 2025) e da Olimpíada Chinesa de Matemática (CMO 2024), alcançando resultados dignos de medalha de ouro.

Fonte da imagem: the-decoder.com

O anúncio afirma que o DeepseekMath-V2 obteve 118 de 120 pontos nos problemas de Putnam, uma pontuação significativamente superior à melhor pontuação humana, de 90. A DeepSeek observa que, anteriormente, os modelos de IA frequentemente produziam respostas corretas para problemas matemáticos complexos, mas não mostravam os passos corretos da solução. Para solucionar isso, o modelo de IA utiliza um processo de múltiplas etapas com um verificador separado para avaliar a correção dos passos de resolução do problema e a necessidade de revisá-los. Essa estrutura permite que o algoritmo verifique e aprimore suas soluções em tempo real.

Tecnicamente, o DeepseekMath-V2 é construído sobre o modelo base Deepseek-V3.2-Exp-Base. A descrição do DeepSeek nunca menciona o uso de ferramentas externas, como calculadoras ou interpretadores de código. Em experimentos importantes, o mesmo modelo DeepseekMath-V2 é usado tanto para a geração quanto para a verificação de provas. O alto desempenho do algoritmo decorre de sua capacidade de analisar e aprimorar suas próprias conclusões sem depender de software externo. Para resolver problemas mais complexos, o modelo aumenta seu poder computacional durante a fase de teste, gerando e verificando múltiplas provas possíveis em paralelo para aumentar a confiança na resposta final.

O lançamento do DeepSeek ocorre após o anúncio de modelos de IA ainda não lançados da OpenAI e do Google DeepMind, que alcançaram resultados semelhantes na resolução de problemas matemáticos complexos. Notavelmente, esses algoritmos obtiveram esse resultado por meio da capacidade de raciocínio, e não por meio de otimização direcionada para competições matemáticas. Se o sucesso desses algoritmos for realmente tão impressionante, isso significaria que os modelos de linguagem estão se aproximando do ponto em que podem resolver problemas complexos e abstratos, tradicionalmente considerados uma habilidade puramente humana.

Vale ressaltar que a decisão do DeepSeek de divulgar os detalhes técnicos de seu modelo DeepseekMath-V2 contrasta fortemente com o sigilo mantido pelo Google e pela OpenAI. Enquanto as empresas americanas mantêm em segredo os detalhes da arquitetura de seus modelos de IA, a startup chinesa está revelando tudo, demonstrando claramente que a empresa está em pé de igualdade com os líderes do setor.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *