A DeepMind, uma subsidiária do Google, especializada em pesquisas no campo da inteligência artificial (IA), relatou as novas realizações do modelo de alfagemetria2 AI na solução de problemas geométricos. O estudo recentemente publicado de DeepMind relata que o alfageometria2 resolveu com sucesso 84 % dos problemas (42 de 50) da Olimpíada Matemática Internacional (IMO) de 2000 a 2024, obtendo a pontuação média do medalhista de ouro (40,9).

Fonte da imagem: Google
O Alphageometria2 é uma versão aprimorada do sistema Alpageometri AI, publicado em janeiro do ano passado. Em julho do ano passado, o DeepMind demonstrou as capacidades do sistema que o United AlphaProof e Alpageometria2, que conseguiram resolver 4 em cada 6 problemas da IMO.
Alpageometria2, usando um modelo linguístico baseado na arquitetura Gemini e um mecanismo aprimorado de dedução simbólica pode determinar as estratégias para resolver problemas com uma precisão que excede as possibilidades da maioria dos especialistas humanos.
A abordagem adotada combina dois componentes principais: um modelo linguístico que pode gerar frases com base em uma descrição geométrica detalhada e no mecanismo simbólico do DDAR (Raciocínio aritmético de banco de dados dedutivo), que verifica a conectividade lógica das soluções propostas, criando um fechamento dedutivo baseado em informações disponíveis.
Simplificando, o modelo Gemini Alpageometria2 oferece as etapas e o design do mecanismo simbólico na linguagem matemática formal e o mecanismo, seguindo certas regras, verifica essas etapas quanto à consistência lógica.
O elemento -chave que permitiu que o alfageometria2 supere a velocidade do antecessor da alfagometria é o algoritmo Skest (conjunto de conhecimento compartilhado das árvores de pesquisa), que implementa uma estratégia de pesquisa iterativa, com base na troca de conhecimento entre várias árvores de busca paralela. Isso permite que você investiga várias soluções, aumentando a velocidade de processamento e melhorando a qualidade das evidências geradas.
A eficácia do sistema aumentou significativamente com a nova implementação do DDAR no C ++, que aumentou sua velocidade 300 vezes em comparação com a versão escrita no Python.
Ao mesmo tempo, devido às características técnicas do alfageometria2, ainda se limita à capacidade de resolver problemas com um número variável de pontos, equações não lineares ou desigualdades. Portanto, a DeepMind estuda novas estratégias, como quebrar tarefas complexas para subtarefas e o uso de treinamento com reforços para a liberação de IA para um novo nível na solução de problemas matemáticos complexos.
É relatado que o alfageometria2 tecnicamente não é o primeiro sistema de IA a atingir o nível de um medalhista de ouro em geometria, mas é o primeiro a conseguir isso com um conjunto de tarefas desse tamanho.
Ao mesmo tempo, o alfageometria2 usa uma abordagem híbrida, pois o modelo Gemini possui uma arquitetura da rede neural, enquanto seu mecanismo simbólico é baseado nas regras.
Os defensores do uso de redes neurais argumentam que ações intelectuais, do reconhecimento de fala a imagens, só podem ser alcançadas usando enormes quantidades de dados e cálculos. Ao contrário dos sistemas simbólicos de IA que resolvem problemas, determinando os conjuntos de regras de manipulação com símbolos destinados a certos problemas, as redes neurais estão tentando resolver problemas por meio de aproximação estatística (substituindo alguns resultados próximos ao original) e exemplos por exemplos. Por sua vez, os apoiadores da IA simbólica acreditam que é mais adequada para a codificação eficaz do conhecimento global.
O DeepMind acredita que a busca por novas maneiras de resolver problemas geométricos complexos, especialmente na geometria euclidiana, pode ser a chave para expandir as capacidades da IA. A solução de problemas requer raciocínio lógico e a capacidade de escolher a etapa certa de vários possíveis. Segundo o DeepMind, essas habilidades serão cruciais para os futuros modelos universais da IA.
