Os modelos de IA do Google DeepMind resolveram problemas de matemática nas Olimpíadas no nível de um medalhista de prata

Google DeepMind, subsidiária de pesquisa de inteligência artificial (IA) do Google com sede em Londres, introduziu modelos de IA AlphaProof e AlphaGeometry 2 que podem resolver problemas matemáticos complexos que os modelos de IA atuais não conseguem resolver.

Fonte da imagem: geralt/Pixabay

Por uma série de razões, a resolução de problemas matemáticos que requerem capacidades avançadas de raciocínio ainda não está ao alcance da maioria dos sistemas de IA. O fato é que esses tipos de problemas requerem a formação e utilização de abstrações. Também requer um planejamento hierárquico complexo, definição de subobjetivos, retrocesso e descoberta de novos caminhos, o que é uma questão difícil para a IA.

Ambos os novos modelos de IA têm a capacidade de realizar raciocínio matemático avançado para resolver problemas matemáticos complexos. AlphaProof foi criado usando aprendizagem por reforço, ganhando a capacidade de provar declarações matemáticas na linguagem de programação Lean formal. Para criá-lo, usamos um modelo de linguagem pré-treinado AlphaZero, um algoritmo de aprendizagem por reforço que anteriormente aprendeu sozinho a jogar xadrez, shogi e pronto. Por sua vez, o AlphaGeometry 2 é uma versão melhorada do sistema AlphaGeometry AI existente, introduzido em janeiro e projetado para resolver problemas de geometria.

Enquanto o AlphaProof foi treinado para resolver problemas em uma ampla variedade de tópicos matemáticos, o AlphaGeometry 2 é otimizado para resolver problemas que envolvem movimentos de objetos e equações que envolvem ângulos, razões e distâncias. Como o AlphaGeometry 2 foi treinado com um número significativamente maior de dados sintéticos do que seu antecessor, ele pode lidar com problemas de geometria muito mais complexos.

Para testar as capacidades dos novos sistemas de IA, os investigadores do Google DeepMind encarregaram-nos de resolver seis problemas da Olimpíada Internacional de Matemática (IMO) deste ano e provar que as respostas estavam corretas. AlphaProof resolveu dois problemas de álgebra e um problema de teoria dos números, um dos quais foi o mais difícil da Olimpíada, enquanto AlphaGeometry 2 resolveu um problema de geometria. Dois problemas em combinatória permaneceram sem solução.

Dois renomados matemáticos, Tim Gowers e Joseph Myers, testaram as soluções fornecidas pelos sistemas. Eles atribuíram a cada uma das quatro respostas corretas o número máximo de pontos (sete de sete), dando aos sistemas um total de 28 pontos de um máximo de 42. Um atleta olímpico que marcasse o mesmo número de pontos teria recebido uma medalha de prata. medalha e teria ficado um pouco aquém do ouro, concedido a quem marcar 29 pontos ou mais.

Pela primeira vez, um sistema de IA foi capaz de alcançar resultados de nível medalha na resolução de problemas matemáticos da IMO. “Como matemático, considero isto muito impressionante e um salto significativo em relação ao que era possível anteriormente”, disse Gowers durante uma conferência de imprensa.

A criação de sistemas de IA que possam resolver problemas matemáticos complexos pode abrir caminho para colaborações emocionantes entre humanos e IA, diz Katie Collins, investigadora da Universidade de Cambridge. Isso, por sua vez, pode nos ajudar a aprender mais sobre como nós, humanos, fazemos matemática. “Ainda não sabemos muito sobre como as pessoas resolvem problemas matemáticos complexos”, diz ela.

avalanche

Postagens recentes

Qualcomm esfriou com a ideia de comprar totalmente a Intel

Rumores sobre as intenções da Qualcomm de comprar toda a empresa Intel surgiram em setembro,…

31 minutos atrás

Conferência das Nações Unidas sobre Alterações Climáticas falha metas de financiamento para economias em desenvolvimento

A 29ª Conferência das Nações Unidas sobre Mudanças Climáticas (COP29), realizada em Baku, conforme relatado…

1 hora atrás

Workshop de desenho de IA, parte doze: prototipagem rápida com FLUX.1 [dev]

A principal dificuldade do FLUX.1 [dev] do ponto de vista do proprietário de um PC…

6 horas atrás

Neuralink lançou o desenvolvimento de uma mão robótica conectada ao cérebro humano

A empresa americana Neuralink Elon Musk, que desenvolve interfaces cérebro-computador, anunciou o início dos testes…

7 horas atrás

As TVs no remake de Silent Hill 2 escondem mensagens criptografadas – elas são escritas em código Morse

A mensagem criptografada nas fotos Polaroid acabou não sendo a única mensagem secreta dos desenvolvedores…

8 horas atrás