Categorias: Programas

O modelo de IA DeepseekMath-V2 conquistou uma medalha de ouro na Olimpíada Internacional de Matemática.

A startup chinesa DeepSeek apresentou um novo modelo de IA, o DeepseekMath-V2, que demonstra resultados impressionantes na resolução de problemas matemáticos complexos. O algoritmo concluiu com sucesso diversas tarefas da Olimpíada Internacional de Matemática (IMO 2025) e da Olimpíada Chinesa de Matemática (CMO 2024), alcançando resultados dignos de medalha de ouro.

Fonte da imagem: the-decoder.com

O anúncio afirma que o DeepseekMath-V2 obteve 118 de 120 pontos nos problemas de Putnam, uma pontuação significativamente superior à melhor pontuação humana, de 90. A DeepSeek observa que, anteriormente, os modelos de IA frequentemente produziam respostas corretas para problemas matemáticos complexos, mas não mostravam os passos corretos da solução. Para solucionar isso, o modelo de IA utiliza um processo de múltiplas etapas com um verificador separado para avaliar a correção dos passos de resolução do problema e a necessidade de revisá-los. Essa estrutura permite que o algoritmo verifique e aprimore suas soluções em tempo real.

Tecnicamente, o DeepseekMath-V2 é construído sobre o modelo base Deepseek-V3.2-Exp-Base. A descrição do DeepSeek nunca menciona o uso de ferramentas externas, como calculadoras ou interpretadores de código. Em experimentos importantes, o mesmo modelo DeepseekMath-V2 é usado tanto para a geração quanto para a verificação de provas. O alto desempenho do algoritmo decorre de sua capacidade de analisar e aprimorar suas próprias conclusões sem depender de software externo. Para resolver problemas mais complexos, o modelo aumenta seu poder computacional durante a fase de teste, gerando e verificando múltiplas provas possíveis em paralelo para aumentar a confiança na resposta final.

O lançamento do DeepSeek ocorre após o anúncio de modelos de IA ainda não lançados da OpenAI e do Google DeepMind, que alcançaram resultados semelhantes na resolução de problemas matemáticos complexos. Notavelmente, esses algoritmos obtiveram esse resultado por meio da capacidade de raciocínio, e não por meio de otimização direcionada para competições matemáticas. Se o sucesso desses algoritmos for realmente tão impressionante, isso significaria que os modelos de linguagem estão se aproximando do ponto em que podem resolver problemas complexos e abstratos, tradicionalmente considerados uma habilidade puramente humana.

Vale ressaltar que a decisão do DeepSeek de divulgar os detalhes técnicos de seu modelo DeepseekMath-V2 contrasta fortemente com o sigilo mantido pelo Google e pela OpenAI. Enquanto as empresas americanas mantêm em segredo os detalhes da arquitetura de seus modelos de IA, a startup chinesa está revelando tudo, demonstrando claramente que a empresa está em pé de igualdade com os líderes do setor.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A empresa de desenvolvimento de robótica Sunday Robotics conta com cerca de uma dúzia de ex-funcionários da Tesla.

Na semana passada, a startup de robótica Sunday Robotics saiu do modo stealth e revelou…

52 minutos atrás

A AMD lançou discretamente a placa gráfica para estações de trabalho Radeon Pro W7900D na China.

A AMD lançou uma nova placa gráfica para estações de trabalho e mencionou mais dois…

1 hora atrás

Um novo patamar de exploração espacial: menos de um dia do lançamento às primeiras fotos de alta resolução da Terra – 3DNews

A empresa americana BlackSky lançou seu terceiro satélite Gen-3 e obteve imagens de alta qualidade…

1 hora atrás

Uma falha de software perigosa no Airbus A320 obrigou mais de 6.500 aeronaves a passarem por uma atualização.

O setor de viagens enfrentou recentemente um desafio repentino, quando a gigante europeia da aviação…

5 horas atrás

O estouro da bolha da IA ​​não trará de volta os empregos dos especialistas demitidos.

Analistas do setor frequentemente expressam preocupação com o perigo de uma bolha da IA ​​devido…

5 horas atrás

A utilização prática da IA ​​no trabalho continua sendo bastante desigual (3DNews).

Embora os desenvolvedores de IA pintem um quadro otimista de um futuro brilhante, a implementação…

6 horas atrás