Categorias: Programas

O modelo de IA DeepseekMath-V2 conquistou uma medalha de ouro na Olimpíada Internacional de Matemática.

A startup chinesa DeepSeek apresentou um novo modelo de IA, o DeepseekMath-V2, que demonstra resultados impressionantes na resolução de problemas matemáticos complexos. O algoritmo concluiu com sucesso diversas tarefas da Olimpíada Internacional de Matemática (IMO 2025) e da Olimpíada Chinesa de Matemática (CMO 2024), alcançando resultados dignos de medalha de ouro.

Fonte da imagem: the-decoder.com

O anúncio afirma que o DeepseekMath-V2 obteve 118 de 120 pontos nos problemas de Putnam, uma pontuação significativamente superior à melhor pontuação humana, de 90. A DeepSeek observa que, anteriormente, os modelos de IA frequentemente produziam respostas corretas para problemas matemáticos complexos, mas não mostravam os passos corretos da solução. Para solucionar isso, o modelo de IA utiliza um processo de múltiplas etapas com um verificador separado para avaliar a correção dos passos de resolução do problema e a necessidade de revisá-los. Essa estrutura permite que o algoritmo verifique e aprimore suas soluções em tempo real.

Tecnicamente, o DeepseekMath-V2 é construído sobre o modelo base Deepseek-V3.2-Exp-Base. A descrição do DeepSeek nunca menciona o uso de ferramentas externas, como calculadoras ou interpretadores de código. Em experimentos importantes, o mesmo modelo DeepseekMath-V2 é usado tanto para a geração quanto para a verificação de provas. O alto desempenho do algoritmo decorre de sua capacidade de analisar e aprimorar suas próprias conclusões sem depender de software externo. Para resolver problemas mais complexos, o modelo aumenta seu poder computacional durante a fase de teste, gerando e verificando múltiplas provas possíveis em paralelo para aumentar a confiança na resposta final.

O lançamento do DeepSeek ocorre após o anúncio de modelos de IA ainda não lançados da OpenAI e do Google DeepMind, que alcançaram resultados semelhantes na resolução de problemas matemáticos complexos. Notavelmente, esses algoritmos obtiveram esse resultado por meio da capacidade de raciocínio, e não por meio de otimização direcionada para competições matemáticas. Se o sucesso desses algoritmos for realmente tão impressionante, isso significaria que os modelos de linguagem estão se aproximando do ponto em que podem resolver problemas complexos e abstratos, tradicionalmente considerados uma habilidade puramente humana.

Vale ressaltar que a decisão do DeepSeek de divulgar os detalhes técnicos de seu modelo DeepseekMath-V2 contrasta fortemente com o sigilo mantido pelo Google e pela OpenAI. Enquanto as empresas americanas mantêm em segredo os detalhes da arquitetura de seus modelos de IA, a startup chinesa está revelando tudo, demonstrando claramente que a empresa está em pé de igualdade com os líderes do setor.

admin

Próximo A OpenAI só se tornará lucrativa em 2030, mas precisará de US$ 207 bilhões para seu desenvolvimento. »

Anterior « A empresa de desenvolvimento de robótica Sunday Robotics conta com cerca de uma dúzia de ex-funcionários da Tesla.

Deixar comentário

Publicado por

admin

8 meses atrás

Microsoft oficialmente enterrou Windows 10x. As melhores ideias aparecerão no Windows 10 habitual

Postagens recentes

Rumores

A empresa indiana Tata poderá inicialmente produzir chips usando apenas a tecnologia de processo de 90 nm

\nA Tata Electronics começou há vários anos a implementar um projeto para construir a primeira…

1 hora atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Google renomeia AI notebook NotebookLM – agora é Gemini Notebook

O Google mudou o nome de sua ferramenta de mineração de dados, NotebookLM. Agora é…

5 horas atrás

Servidores, clusters, supercomputadores, computadores industriais e multiprocessadores

Spintrônica: o que aconteceu? / Offsyanka.

\nA carga elétrica serviu fielmente a humanidade, alimentando a operação de sistemas elétricos semicondutores, por…

6 horas atrás

Servidores, clusters, supercomputadores, computadores industriais e multiprocessadores

Elon Musk comprou empresa de energia por US$ 1 bilhão para abastecer a gigafábrica Colossus AI

\nElon Musk adquiriu discretamente a empresa de energia APR Energy, que opera uma frota de…

7 horas atrás

Jogos

Hot Wheels Infinite Rush saiu de Silent Hill: Townfall e Control Resonant – um jogo de arcade de corrida em miniatura será lançado duas semanas antes

\nDesenvolvido pelo estúdio italiano Milestone (séries MotoGP, MXGP, Ride), o arcade de corrida Hot Wheels…