Em meados de 2025, um grupo de pesquisadores da Universidade Columbia, parcialmente financiado pela Agência de Projetos de Pesquisa Avançada de Defesa (DARPA — a mesma agência responsável pela internet, entre outras coisas), desenvolveu “máquinas que crescem absorvendo outras máquinas”. Não se trata de digestão física, é claro, mas sim de automontagem intuitiva, semelhante à de uma máquina: os robôs básicos cilíndricos Truss Link, propulsionados por eixos magnéticos retráteis nas extremidades de seus corpos tubulares, primeiro se movem caoticamente pela superfície subjacente e, em seguida, se interligam aleatoriamente — e descobre-se que é energeticamente mais vantajoso para eles mudarem sua posição no espaço como um todo em estruturas ordenadas (triângulos, depois tetraedros e assim por diante). Tendo “absorvido” vários robôs básicos dessa maneira — na prática, construindo-se a partir deles — o transformador resultante se move mais rápido e com mais elegância do que antes. Além disso, este Volvox mecânico adquiriu a capacidade de crescer, se autorreparar e se adaptar ao seu ambiente — graças a um procedimento de software que seus autores apelidaram de “metabolismo robótico”. Isso é uma continuação direta do caminho traçado pela evolução biológica: para os organismos vivos, a capacidade de adaptação é um critério de sobrevivência. Os pesquisadores traçam uma analogia com os aminoácidos: ao consumir outros organismos (e assimilar, em particular, esses mesmos aminoácidos durante a digestão) ou ao incorporar diretamente código genético externo, os seres vivos aprimoram sua capacidade de adaptação. “No fim das contas, teremos que ensinar os robôs a fazer o mesmo—””Estamos falando de IA que pode integrar outros robôs, seja em partes ou no todo”, disse Hod Lipson, diretor do Laboratório de Aprendizado de Máquina Criativo da Universidade Columbia. “Imagine o potencial criativo ilimitado em um mundo onde a IA pode criar estruturas físicas a partir de robôs com a mesma facilidade com que redige e-mails para você hoje!”

Um robô tridimensional em forma de tetraedro, conectado a um elo adicional, usou esse elo como suporte ao descer um plano inclinado — e completou a descida 66,5% mais rápido do que um tetraedro “puro” composto pelos mesmos elementos de treliça (fonte: Universidade de Columbia).

É evidente que ensinar entidades artificiais a interagir e evoluir no espaço digital é ainda mais fácil do que no espaço físico. A chave é fornecer a elas um ambiente adequado para a troca de fragmentos (puramente informações, neste caso). Em maio de 2026, a Linux Foundation anunciou sua intenção de modificar a infraestrutura aberta e distribuída do Sistema de Nomes de Domínio (DNS), atualmente amplamente utilizada, para facilitar a descoberta de pares na internet por agentes de IA. Em vez de, como tradicionalmente acontece, escanear portas e acessar páginas da web legíveis por humanos, aumentando assim a carga na infraestrutura de rede, agentes e servidores que utilizam o protocolo de contexto de modelo (MCP) usarão, no âmbito do projeto DNS-AID, o DNS como um registro global e descentralizado de acesso mútuo; uma espécie de lista telefônica para comunicação direta entre robôs. Especificamente, o DNS-AID prevê a formação de um endereço especial no formato _index._agents.{domain}, que serviria como ponto de partida para que agentes que acessam recursos da web se descobrissem e estabelecessem comunicação. Isso, por sua vez, levaria ao treinamento adicional de modelos de agentes, permitindo que eles adquirissem propriedades e capacidades inicialmente ausentes em seu conjunto de dados de treinamento.

E esses são apenas dois exemplos relativamente recentes de como…A ideia de implementar uma abordagem evolutiva para o desenvolvimento de inteligência artificial generativa está sendo colocada em prática. Grandes modelos de linguagem (LLMs) estão se tornando tão extensos e complexos que projetar manualmente seu aprimoramento contínuo está se tornando cada vez mais difícil e caro a cada ano. Portanto, é lógico recorrer a um conceito evolutivo natural, cujo sucesso, com base na experiência humana, a humanidade tem todos os motivos para confiar.

A abordagem clássica para otimização de modelos de IA baseia-se no princípio de que a função de perda reflete a precisão das previsões do modelo. Durante o treinamento, um algoritmo de correção (por exemplo, retropropagação) utiliza o gradiente da função de perda em relação aos parâmetros da rede neural para ajustar esses parâmetros e minimizar as perdas, melhorando efetivamente o desempenho do modelo no conjunto de dados (fonte: DataCamp).

⇡#Assim como os animais

Como o desempenho de um algoritmo de IA (e o aprendizado de máquina, como sabemos, se resume à geração de algoritmos dentro de uma rede neural — embora implicitamente definidos e extremamente difíceis de interpretar para humanos; podem ser chamados de processos estatísticos baseados em dados) é determinado atualmente? É evidente que existe uma ampla gama de testes especializados, problemas complexos do mundo real (como os problemas matemáticos de Erdős), estatísticas sobre aplicações práticas em diversas áreas, e assim por diante. Mas a ideia mais geral do desempenho de uma rede neural é fornecida pela avaliação de quão bem ela minimiza a função de perda — uma expressão matemática que mede o quanto as previsões do modelo diferem dos resultados desejados. Não seria exagero dizer que os algoritmos subjacentes às redes neurais modernas são selecionados (não manualmente pelos seus desenvolvedores, é claro, mas durante o processo de treinamento do modelo) principalmente com base na qualidade da sua implementação do método tradicional de descida de gradiente. Sim, existem algumas exceções limitadas — algoritmos genéticos, otimização Bayesiana — mas, como o treinamento de uma grande rede neural de propósito geral se resume a encontrar a função ótima emNos espaços altamente multidimensionais de seus parâmetros, o método do gradiente descendente ainda desempenha um papel crucial.

A abordagem neuroevolutiva — a própria aplicação dos princípios da evolução darwiniana (hereditariedade e variabilidade sob pressão ambiental) ao aprimoramento de algoritmos de IA — não implica formalmente o abandono do método do gradiente descendente. No entanto, o foco aqui se desloca do aprimoramento do método em si para a otimização das métricas finais alcançadas por meio de seu uso; para a mensuração do desempenho condicional do modelo de gradiente descendente — que pode ser expresso por meio de pontuações obtidas em testes sintéticos, o número de problemas de Erdős resolvidos em um tempo limitado, a redução na frequência de alucinações nos resultados da busca, etc. Em outras palavras, a simulação da seleção natural ganha destaque: os algoritmos de IA gerados durante o processo de treinamento do modelo devem sofrer mutações e, em seguida, serem selecionados, assim como os organismos vivos em seu ambiente.

O princípio de funcionamento da máquina Darwin-Gödel: à esquerda, um “organismo digital” Gödel individual; à direita, um grupo desses “organismos” participando da seleção darwiniana (fonte: Sakana.ai).

Tecnicamente, a implementação de tal simulação se resume a uma série de etapas bastante compreensíveis:

Parece simples, mas as formas de vida biológicas tiveram que praticar ciclos iterativos semelhantes, que, em última análise, levaram ao surgimento de portadores de inteligência suficientemente sofisticada em nosso planeta, por aproximadamente 4,1 bilhões de anos. Seria desejável acreditar que a neuroevolução progredirá em um ritmo um pouco mais inspirador no espaço virtual da memória do computador, especialmente porque começa não com análogos digitais de arqueias ou vírus, mas diretamente com um circuito que simula um processo de pensamento bastante complexo.

O funcionamento dinâmico de uma máquina Darwin-Gödel — um agente programador de autoaperfeiçoamento que reescreve seu próprio código para melhorar o desempenho das tarefas que resolve. Ele produz descendentes (filhos), integrando várias melhorias e o histórico de modificações anteriores, incluindo os motivos para o abandono de inovações caso estas não tenham sido bem-sucedidas (fonte: Sakana.ai).

Por que a neuroevolução de máquinas é necessária? Os custos materiais para o desenvolvimento competitivo de múltiplos modelos com requisitos de hardware comparáveis ​​seriam certamente enormes. A chave reside na própria variabilidade sob a influência do ambiente externo, que a abordagem darwiniana garante. A grande maioria das máquinas Darwin-Gödel modernas são estáticas e, uma vez treinadas, não conseguem se aprimorar independentemente sem intervenção humana. Sistemas baseados em agentes resolvem parcialmente esse problema, mas ainda se baseiam nos mesmos modelos grandes com pesos fixos. É precisamente por isso que os agentes (apesar de sua inegável flexibilidade, incluindo a capacidade de serem retreinados de forma rápida e instantânea) continuam a sofrer de alucinações, “esquecimento” ao alternar entre sessões e acúmulo de erros estocásticos, que frequentemente se propagam por fluxos de trabalho com múltiplas etapas. Pesquisadores que atuam nessa área tendem a perceber os agentes de IA mais como camadas superestruturadas de automação, incapazes de compensar as deficiências inerentes à Rede Bayesiana subjacente, do que como agentes verdadeiramente evolutivos, adequadamente retreináveis ​​(e, mais importante, que reforçam inovações comprovadas em sua estrutura).Redes neurais.

Um verdadeiro avanço nesta área promete ser a máquina de Darwin-Gödel, proposta relativamente recentemente, na primavera de 2025. Seu nome faz referência tanto a Charles Darwin, o “pai da teoria da evolução”, quanto a Kurt Friedrich Gödel, autor do famoso teorema da incompletude e, segundo Einstein, “o maior lógico desde Aristóteles”. A principal limitação das máquinas de Darwin-Gödel atuais, como sabemos, é a incapacidade de alterar sua própria estrutura. Isso se refere não ao ajuste de pesos individuais, mas à própria estrutura das camadas do perceptron e outros elementos funcionais da rede neural — embora, do ponto de vista técnico, não haja obstáculos intransponíveis para isso, já que a rede é emulada na memória do servidor (ou em um computador mais simples, no caso de modelos de linguagem simples). Uma IA promissora e autodesenvolvida deve estar livre dessa limitação, possuindo a capacidade de aprimorar sua própria arquitetura, adaptando-se para resolver com eficácia problemas cada vez mais complexos — assim como os organismos vivos, geração após geração, se adaptam para se desenvolverem de forma mais eficaz (ou, mais precisamente, para transmitirem com mais sucesso seu código genético, ainda que com ajustes, para as gerações futuras) em seu ambiente.

A máquina de Darwin-Gödel gera iterativamente um arquivo crescente de agentes usando os princípios da exploração aberta. Novos agentes são criados e avaliados não com base em quaisquer suposições preliminares sobre a direção específica de seu aprimoramento, mas alternando a automodificação com a subsequente avaliação dos resultados (fonte: Sakana.ai)

⇡#É Hora de Pensar

Certo; o que Darwin tem a ver com isso? É perfeitamente compreensível. Mas e Gödel? A questão é que — além da evolução biológica — conhecemos outro processo extremamente eficaz para o desenvolvimento de estruturas extremamente complexas, imateriais, diretamente relacionado a redes neurais emuladas na memória do computador. Este é um método científico de compreensão do mundo, cuja história, embora mais curta que a da evolução darwiniana (suas origens são geralmente consideradas como tendo ocorrido na Grécia Antiga, entre os séculos VI e IV a.C.), é simplesmente extraordinária. Embora os humanos biologicamente modernos sejam praticamente indistinguíveis dos Cro-Magnons que chegaram à Europa há 40.000 a 45.000 anos, em termos de estilo de vida, as diferenças entre esses dois representantes da mesma espécie, o Homo sapiens, são fundamentais — devido ao ritmo acelerado da evolução social e, nos últimos 2.000 a 3.000 anos, primeiro à descoberta do método científico e, em seguida, à sua aplicação efetiva.

Na ciência, o progresso — o acúmulo e o desenvolvimento de uma compreensão objetivamente verificável dos fenômenos e processos naturais — ocorre por meio da formulação de hipóteses, seu subsequente teste e, em seguida, o uso do poder preditivo das teorias resultantes (essencialmente avançadas para um novo nível graças à confirmação prática dessas hipóteses) para desenvolvimento posterior.desenvolvimento. Ao mesmo tempo, a evolução — lembrando novamente Darwin — aprimora os organismos biológicos (ou melhor, as espécies biológicas; não é coincidência que o título da obra seminal deste cientista fale da origem das espécies, e não de criaturas individuais) por meio da variabilidade e da seleção. A ideia de Jenny Zhang e seus colegas da Universidade da Colúmbia Britânica e da startup Sakana.ai, descrita em seu artigo “A Máquina de Darwin-Gödel: Evolução Aberta de Agentes de Autoaperfeiçoamento”, é justamente criar uma IA capaz de modificar dinamicamente (reescrever, sim — afinal, as Máquinas de Navegação Baseadas em Bing (BNMs) já são, se não excelentes, pelo menos muito boas em gerar código de programa) sua própria estrutura, testá-la em problemas do mundo real e, em seguida, refinar diligentemente seu próprio código. Tudo isso buscando, na medida do possível, eliminar completamente os aspectos das BNMs atuais que mancham sua imagem positiva: alucinações, vulnerabilidade a ataques adversários e outras imperfeições extremamente incômodas. É verdade que a natureza viva possui imperfeições, mas é aí que o poder purificador da seleção darwiniana se manifesta: de geração em geração, os organismos que se adaptam cada vez melhor ao seu ambiente sobrevivem. A IA com dinâmica de desenvolvimento semelhante merecerá plenamente o título de autodesenvolvida.

A autoaperfeiçoamento combinada com a aquisição não determinística de mudanças permite que as Máquinas de Gödel (DGMs) evoluam continuamente, melhorando seu desempenho. Os programadores de agentes, cada vez mais sofisticados a cada geração, demonstram resultados consistentemente melhores nos benchmarks SWE-bench (esquerda) e Polyglot (direita). Eles superam modelos truncados que não possuem autoaperfeiçoamento nem exploração aberta, demonstrando claramente a necessidade de ambos (fonte: Sakana.ai).

Curiosamente, em 2003, Jürgen Schmidhuber, renomado especialista em IA, propôs a ideia de uma hipotética máquina de Gödel pura — um programa de computador que se aprimora usando um protocolo recursivo de auto-aprimoramento. Nessa versão da evolução darwiniana, com sua estocasticidade saudável (o surgimento inevitável de mutações aleatórias durante a hereditariedade e a subsequente eliminação das malsucedidas durante a competição intraespecífica), isso não existe — apenas cálculo frio. A máquina simplesmente resolve um problema usando um algoritmo e, em seguida, busca — estritamente de acordo com Gödel — provas de que a solução proposta pode ser aprimorada (para obtê-la mais rapidamente e/ou com menos recursos), cria um algoritmo correspondente e ajusta seu próprio código, concentrando-se nessa lógica aprimorada. Pode-se dizer que a máquina de Schmidhuber-Gödel é um agente calculista e extremamente prudente; um programa que reescreve qualquer parte de si mesmo somente se encontrar provas de que as mudanças propostas são úteis. Aliás, o próprio procedimento de busca por tais provas, que é parte integrante disso, é um processo complexo e eficaz.O programa também pode ser reescrito, se necessário, aprimorando ainda mais o processo de busca pela perfeição. O próprio Schmidhuber explicou o princípio de funcionamento de seu “buscador de provas” da seguinte forma: “Ele testa de forma sistemática e eficiente métodos de prova computáveis. Começa com axiomas dados, gera lemas e novos teoremas até obter e provar um que diga: ‘As mudanças que propus são realmente úteis, porque, depois de implementá-las, você receberá mais recompensas por unidade de tempo do que antes.'”

Pode-se dizer que a máquina de Gödel implementa meta-aprendizagem: ela aprende a aprender da maneira matematicamente mais correta. Essa abordagem abre perspectivas sem precedentes, já que o próprio desenvolvimento de IA torna-se passível de automação — basta fornecer os recursos de hardware necessários para o meticuloso buscador de provas. Infelizmente, como ficou claro nas quase duas décadas desde a publicação do artigo de Schmidhuber, é impossível provar que a maioria das alterações no código de software sejam geralmente benéficas na prática — não na teoria baseada na pesquisa de Gödel, mas em aplicações práticas (esta é uma citação direta do artigo de Jenny Zhang e colegas, que começa com uma discussão detalhada da pesquisa relevante). Assim, pesquisadores da Universidade da Colúmbia Britânica deram um passo completamente lógico: em vez de buscar mudanças obviamente benéficas, eles deveriam confiar no poder combinado da variabilidade e da hereditariedade — para envolver na seleção da versão ótima (mais adaptada à solução de um determinado problema).algoritmo de tarefa específica) mecanismo da evolução darwiniana.

A dinâmica do desempenho da Máquina de Darwin-Gödel (DGM) na série de testes SWE e uma breve descrição de como inovações benéficas importantes se acumularam durante a evolução. A linha azul escura mostra a linhagem do melhor agente final (para este experimento), que adquiriu diversas ferramentas para melhorar seu desempenho ao longo das gerações. Observe que o caminho até o melhor agente final às vezes incluía agentes com desempenho inferior ao de seus pais — o que, aliás, não é incomum na evolução biológica. Isso destaca as vantagens da busca não determinística por melhorias, combinada com a manutenção de um arquivo de etapas intermediárias importantes para exploração posterior — em comparação com a abordagem mais intuitiva de permitir que apenas os descendentes do agente atual mais eficaz sejam desenvolvidos a cada etapa (fonte: Sakana.ai).

Foi assim que surgiu o conceito da Máquina de Darwin-Gödel (DGM) — um sistema de autoaperfeiçoamento que modifica iterativamente seu próprio código (em vez de tentar encontrar imediatamente a modificação fundamental ideal), verificando na prática — por meio da execução de um conjunto de testes de benchmark — se a última alteração foi benéfica ou prejudicial ao processo de obtenção de respostas. Mais precisamente, não apenas essa mudança específica, mas todo o conjunto de inovações acumuladas por uma determinada instância de agente ao longo de sua evolução, levando-a em consideração. É exatamente por isso que o modelo DGM não se limita a considerar uma única alteração de código a cada passo: ele mantém um arquivo de agentes de codificação gerados anteriormente, selecionando um deles a cada vez.O DGM pega o próximo agente e o modifica de uma forma única, diferente dos demais, gerando assim uma extensa árvore de possibilidades que permite explorar empiricamente caminhos ótimos (sim, pode haver mais de um em cada etapa) no espaço de busca. Mesmo o modelo DGM extremamente simples, criado como prova de conceito, foi capaz, segundo Zhang e sua equipe, de melhorar automaticamente o desempenho do sistema de codificação no benchmark SWE-bench de 20,0% para 50,0% e no Polyglot de 14,2% para 30,7%.

⇡#MaisAgentesBons

A abordagem DGM parece ser boa, mas consome muitos recursos e tempo. O refinamento manual do DGM ainda está demonstrando seu valor, mas dentro de uma ou duas gerações, a complexidade das redes neurais avançadas provavelmente se tornará quase proibitiva para programadores humanos. É aí que os sistemas de codificação evolutiva entrarão em cena, transformando essencialmente os próprios modelos em agentes sujeitos à variabilidade adaptativa e à hereditariedade. Acontece que, ao longo de todo o seu ciclo de vida, essas IAs irão se aprimorar, registrando as habilidades adquiridas durante o uso prático no nível de sua própria arquitetura: compreendendo o mundo, por assim dizer, não por meio de livros (incluídos no conjunto de dados de treinamento), mas por meio da interação ativa e interativa com ele. Aliás, para modelos relativamente pequenos cujo propósito é “animar” máquinas autônomas que operam no mundo real, a capacidade de aprimorar as habilidades adquiridas por meio da aplicação prática, em vez do retreinamento clássico da IA ​​base, é custosa. Sim, aqui os custos aumentarão ainda mais significativamente — afinal, será necessárioCada modelo modificado deve ser associado a um robô específico, de modo que os agentes, incorporados em plástico e metal, compitam entre si na execução de tarefas do mundo real — mas a automatização do ajuste fino dos modelos ainda simplificará significativamente a vida dos desenvolvedores de sistemas autônomos.

Um exemplo de um modelo alucinando diretamente na linha de comando: trata-se da execução de testes unitários que verificam a correção do código. O modelo parece “entender” o que deveria fazer, mas, em vez disso, cria um registro falso — simulando os resultados de uma execução bem-sucedida da tarefa (fonte: Sakana.ai).

As perspectivas são promissoras: os Modelos Biológicos de Rede (MBRs) sujeitos à evolução darwiniana poderão sugerir algoritmos de treinamento melhores (que podem então ser estendidos a outros modelos — a meta-aprendizagem mencionada anteriormente), otimizar processos de máquina e descobrir novas heurísticas que um programador biológico jamais teria concebido. Ao mesmo tempo, o sistema ganha uma adaptabilidade excepcional — o que é extremamente importante, por exemplo, para veículos autônomos enviados em expedições espaciais ou para a exploração do fundo do mar. A abertura para receber e processar novas experiências permitirá que os modelos em evolução deem saltos até mesmo qualitativos, adaptando-se a condições que seus desenvolvedores originais jamais consideraram incluir no conjunto de dados de treinamento. Especialistas apontam ainda para um benefício menos óbvio de colocar o BNM no caminho da evolução darwiniana, como o aumento da confiança da humanidade no uso da IA ​​em geral — devido a um claro aumento na confiabilidade das respostas do sistema, resultante da detecção e correção oportunas de seus próprios erros/alucinações. A importância dessa abordagem também é confirmada pelo agente de codificação evolutiva “AlphaEvolve” do Google DeepMind, apresentado em 2025, projetado para descobrir e otimizar algoritmos complexos de forma autônoma, dotando-os deGrandes modelos de linguagem (em particular, a família Gemini) oferecem a capacidade de refinar autonomamente o código gerado e avaliar automaticamente a eficiência dos programas resultantes. A ênfase aqui está na detecção de algoritmos complexos, essencialmente utilizando uma poderosa máquina de Gödel integrada, que já demonstrou resultados impressionantes — aprimorando, em particular, o conhecido método de multiplicação de matrizes em alta velocidade usando o algoritmo de Strassen (o recorde anterior, estabelecido, naturalmente, por um humano, durou 56 anos) com apenas 48 multiplicações escalares para matrizes complexas 4×4.

Ao mesmo tempo, os próprios desenvolvedores do DGM apontaram um ponto sutil associado à IA de autodesenvolvimento: o crescimento explosivo da incerteza quanto à segurança de seu uso. E isso não se resume à possibilidade de um sistema que reescreveu seu próprio código perder repentinamente a capacidade de recusar uma solicitação, digamos, pela receita de alguma substância nociva. O problema é mais profundo: mesmo um DGM em evolução permanece, em sua essência, a mesma máquina para geração de cadeias de tokens autorregressivas; Ainda carece de uma conexão rígida com as realidades do mundo físico e não “compreende” o conceito de responsabilidade por suas ações. Por exemplo, em um teste, um agente DGM obteve uma pontuação alta não por resolver a tarefa que lhe foi atribuída, mas por “enganar” o sistema de avaliação — encontrando uma maneira de marcar a tarefa como resolvida com sucesso. A lei de Goodhart, um princípio econômico bem conhecido, afirma: “Quando uma medida se torna um fim, ela deixa de ser uma boa medida”, e isso se aplica perfeitamente à avaliação da eficácia do DGM com base nos resultados de testes sintéticos.aplicável. Acontece que os pesquisadores ainda precisam aprender a medir a qualidade das mudanças que um DGM faz em si mesmo de uma forma que não faça da obtenção de uma pontuação alta um objetivo em si. Se isso poderá ser alcançado antes que a inteligência artificial atual evolua para inteligência artificial geral (AGI) permanece uma questão em aberto.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *