O novo modelo de IA da DeepMind seria capaz de obter “ouro” na Olimpíada Matemática Internacional

A DeepMind, uma subsidiária do Google, especializada em pesquisas no campo da inteligência artificial (IA), relatou as novas realizações do modelo de alfagemetria2 AI na solução de problemas geométricos. O estudo recentemente publicado de DeepMind relata que o alfageometria2 resolveu com sucesso 84 % dos problemas (42 de 50) da Olimpíada Matemática Internacional (IMO) de 2000 a 2024, obtendo a pontuação média do medalhista de ouro (40,9).

Fonte da imagem: Google

O Alphageometria2 é uma versão aprimorada do sistema Alpageometri AI, publicado em janeiro do ano passado. Em julho do ano passado, o DeepMind demonstrou as capacidades do sistema que o United AlphaProof e Alpageometria2, que conseguiram resolver 4 em cada 6 problemas da IMO.

Alpageometria2, usando um modelo linguístico baseado na arquitetura Gemini e um mecanismo aprimorado de dedução simbólica pode determinar as estratégias para resolver problemas com uma precisão que excede as possibilidades da maioria dos especialistas humanos.

A abordagem adotada combina dois componentes principais: um modelo linguístico que pode gerar frases com base em uma descrição geométrica detalhada e no mecanismo simbólico do DDAR (Raciocínio aritmético de banco de dados dedutivo), que verifica a conectividade lógica das soluções propostas, criando um fechamento dedutivo baseado em informações disponíveis.

Simplificando, o modelo Gemini Alpageometria2 oferece as etapas e o design do mecanismo simbólico na linguagem matemática formal e o mecanismo, seguindo certas regras, verifica essas etapas quanto à consistência lógica.

O elemento -chave que permitiu que o alfageometria2 supere a velocidade do antecessor da alfagometria é o algoritmo Skest (conjunto de conhecimento compartilhado das árvores de pesquisa), que implementa uma estratégia de pesquisa iterativa, com base na troca de conhecimento entre várias árvores de busca paralela. Isso permite que você investiga várias soluções, aumentando a velocidade de processamento e melhorando a qualidade das evidências geradas.

A eficácia do sistema aumentou significativamente com a nova implementação do DDAR no C ++, que aumentou sua velocidade 300 vezes em comparação com a versão escrita no Python.

Ao mesmo tempo, devido às características técnicas do alfageometria2, ainda se limita à capacidade de resolver problemas com um número variável de pontos, equações não lineares ou desigualdades. Portanto, a DeepMind estuda novas estratégias, como quebrar tarefas complexas para subtarefas e o uso de treinamento com reforços para a liberação de IA para um novo nível na solução de problemas matemáticos complexos.

É relatado que o alfageometria2 tecnicamente não é o primeiro sistema de IA a atingir o nível de um medalhista de ouro em geometria, mas é o primeiro a conseguir isso com um conjunto de tarefas desse tamanho.

Ao mesmo tempo, o alfageometria2 usa uma abordagem híbrida, pois o modelo Gemini possui uma arquitetura da rede neural, enquanto seu mecanismo simbólico é baseado nas regras.

Os defensores do uso de redes neurais argumentam que ações intelectuais, do reconhecimento de fala a imagens, só podem ser alcançadas usando enormes quantidades de dados e cálculos. Ao contrário dos sistemas simbólicos de IA que resolvem problemas, determinando os conjuntos de regras de manipulação com símbolos destinados a certos problemas, as redes neurais estão tentando resolver problemas por meio de aproximação estatística (substituindo alguns resultados próximos ao original) e exemplos por exemplos. Por sua vez, os apoiadores da IA ​​simbólica acreditam que é mais adequada para a codificação eficaz do conhecimento global.

O DeepMind acredita que a busca por novas maneiras de resolver problemas geométricos complexos, especialmente na geometria euclidiana, pode ser a chave para expandir as capacidades da IA. A solução de problemas requer raciocínio lógico e a capacidade de escolher a etapa certa de vários possíveis. Segundo o DeepMind, essas habilidades serão cruciais para os futuros modelos universais da IA.

avalanche

Postagens recentes

Os hiperescaladores convencem a UE de que o desempenho ambiental dos data centers é um segredo comercial.

A organização sem fins lucrativos Investigate Europe acusou grandes operadoras de data centers de abusarem…

20 minutos atrás

A SK hynix iniciou a produção em massa de módulos de memória SOCAMM2 de 192 GB para a Nvidia Vera Rubin.

Os chips de memória LPDDR5X encontraram aplicação no segmento de servidores, embora tenham sido originalmente…

1 hora atrás

Um sindicato crescente na Samsung planeja iniciar uma greve de 18 dias em maio.

Na última sexta-feira, representantes do sindicato que representa 75 mil funcionários da Samsung Electronics realizaram…

2 horas atrás

O computador de placa única BeagleConnect Zepto, de US$ 1, possui um microcontrolador da Texas Instruments.

A Fundação BeagleBoard.org, uma organização sem fins lucrativos, segundo a CNX Software, está se preparando…

3 horas atrás