Categorias: Programas

O modelo de IA DeepseekMath-V2 conquistou uma medalha de ouro na Olimpíada Internacional de Matemática.

A startup chinesa DeepSeek apresentou um novo modelo de IA, o DeepseekMath-V2, que demonstra resultados impressionantes na resolução de problemas matemáticos complexos. O algoritmo concluiu com sucesso diversas tarefas da Olimpíada Internacional de Matemática (IMO 2025) e da Olimpíada Chinesa de Matemática (CMO 2024), alcançando resultados dignos de medalha de ouro.

Fonte da imagem: the-decoder.com

O anúncio afirma que o DeepseekMath-V2 obteve 118 de 120 pontos nos problemas de Putnam, uma pontuação significativamente superior à melhor pontuação humana, de 90. A DeepSeek observa que, anteriormente, os modelos de IA frequentemente produziam respostas corretas para problemas matemáticos complexos, mas não mostravam os passos corretos da solução. Para solucionar isso, o modelo de IA utiliza um processo de múltiplas etapas com um verificador separado para avaliar a correção dos passos de resolução do problema e a necessidade de revisá-los. Essa estrutura permite que o algoritmo verifique e aprimore suas soluções em tempo real.

Tecnicamente, o DeepseekMath-V2 é construído sobre o modelo base Deepseek-V3.2-Exp-Base. A descrição do DeepSeek nunca menciona o uso de ferramentas externas, como calculadoras ou interpretadores de código. Em experimentos importantes, o mesmo modelo DeepseekMath-V2 é usado tanto para a geração quanto para a verificação de provas. O alto desempenho do algoritmo decorre de sua capacidade de analisar e aprimorar suas próprias conclusões sem depender de software externo. Para resolver problemas mais complexos, o modelo aumenta seu poder computacional durante a fase de teste, gerando e verificando múltiplas provas possíveis em paralelo para aumentar a confiança na resposta final.

O lançamento do DeepSeek ocorre após o anúncio de modelos de IA ainda não lançados da OpenAI e do Google DeepMind, que alcançaram resultados semelhantes na resolução de problemas matemáticos complexos. Notavelmente, esses algoritmos obtiveram esse resultado por meio da capacidade de raciocínio, e não por meio de otimização direcionada para competições matemáticas. Se o sucesso desses algoritmos for realmente tão impressionante, isso significaria que os modelos de linguagem estão se aproximando do ponto em que podem resolver problemas complexos e abstratos, tradicionalmente considerados uma habilidade puramente humana.

Vale ressaltar que a decisão do DeepSeek de divulgar os detalhes técnicos de seu modelo DeepseekMath-V2 contrasta fortemente com o sigilo mantido pelo Google e pela OpenAI. Enquanto as empresas americanas mantêm em segredo os detalhes da arquitetura de seus modelos de IA, a startup chinesa está revelando tudo, demonstrando claramente que a empresa está em pé de igualdade com os líderes do setor.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A Swatch exigiu da Samsung uma indenização de 170 milhões de dólares por copiar o design dos mostradores de seus relógios inteligentes.

Como a prática demonstra, até mesmo o formato de um retângulo com cantos arredondados pode…

49 minutos atrás

Cientistas criaram um pixel que ensinará as telas a enxergar.

Para diversas aplicações, seria tentador combinar as funções de tela e câmera em uma única…

49 minutos atrás

Kingdom Come: Deliverance 2 atinge novo pico de vendas e recebe uma missão com o “bobo da corte excêntrico” de Balatro.

A editora Deep Silver e os desenvolvedores da Warhorse Studios, da República Tcheca, comemoraram as…

1 hora atrás

A Microsoft corrigiu diversos problemas de Bluetooth no Windows 11 e melhorou a experiência com os AirPods da Apple.

A Microsoft lançou a maior atualização de recursos Bluetooth até o momento para o Windows…

1 hora atrás

A Chuwi começou a aceitar pré-encomendas para o laptop UniBook com processador Intel Wildcat Lake e preço inicial de US$ 449.

A Chuwi anunciou a pré-venda do notebook UniBook, equipado com o novo processador Intel Core…

1 hora atrás

A Apatura está tentando convencer os moradores de que o centro de dados de 300 MW construído em frente às suas casas só trará benefícios para eles.

Mais de 800 objeções foram registradas em resposta a um plano para construir um data…

1 hora atrás