As pessoas em breve deixarão de entender como a IA funciona, alertam os principais desenvolvedores

Cerca de cinquenta especialistas renomados na área de inteligência artificial, incluindo engenheiros da OpenAI, Google DeepMind e Anthropic, publicaram os resultados de um estudo segundo o qual uma pessoa pode em breve perder a capacidade de seguir as cadeias de raciocínio de grandes modelos de linguagem.

Fonte da imagem: Igor Omilaev/unsplash.com

Modelos de IA baseados na arquitetura Transformer não podem prescindir da construção de cadeias de raciocínio ao resolver problemas complexos. Para transitar entre as camadas da rede neural, esses raciocínios devem assumir a forma de texto legível por humanos. Pesquisadores designaram essa característica como uma propriedade de raciocínio externalizada. Ao executar tarefas bastante complexas, o modelo recorre a um formato de texto como memória de trabalho. Se a IA utilizar linguagem humana para isso, o desenvolvedor mantém a capacidade de ler seus “pensamentos”.

Essas cadeias incluem raciocínio bastante explícito. Nesse caso, o modelo pode admitir hacking ou sabotagem, o que ajuda os pesquisadores a detectar tentativas de comportamento inadequado da IA. Além da forte necessidade de “pensar em voz alta” ao lidar com problemas complexos, o modelo também pode ter sua própria tendência a raciocinar abertamente, tendência que pode desaparecer quando o mecanismo de aprendizagem muda. Por exemplo, quando o aprendizado por reforço é ampliado, o modelo pode mudar de uma linguagem clara para uma linguagem própria.

Este problema não pode ser resolvido à força – a IA pode começar a fingir que se comporta decentemente, mas ocultar a verdadeira situação. Há outra opção – o raciocínio do modelo em um espaço matemático oculto, que fornece à IA melhores resultados, mas não será mais possível ler tal raciocínio. Há exemplos em que o Anthropic Claude 4 Opus tentou chantagear uma pessoa, e o OpenAI o3 sabotou comandos de desligamento.

Para abordar essas questões, os autores do estudo propõem o desenvolvimento de métodos padrão para avaliar a capacidade de monitorar a IA, publicar resultados e implementar modelos com transparência. Isso é mais importante do que a corrida pelo desempenho, apontam os pesquisadores.

admin

Postagens recentes

Tesla lança raquete de pickleball por US$ 350

A Tesla, fabricante de carros elétricos de Elon Musk, lança regularmente produtos inusitados, sejam eles…

1 hora atrás

A fabricante de caminhões elétricos Nikola, que entrou em falência, agora conta com apenas um funcionário e um prejuízo de US$ 556 milhões.

Em fevereiro deste ano, a Nikola Motor, que tentava iniciar a produção de caminhões movidos…

2 horas atrás

A CATL planeja iniciar a produção em massa de baterias de íon-sódio para veículos elétricos e outras aplicações em 2026.

Em abril deste ano, a empresa chinesa CATL, líder global na produção de baterias de…

2 horas atrás

A NEC do Japão está interrompendo o desenvolvimento de estações base 4G e 5G, por não conseguir competir com as empresas chinesas e europeias.

A NEC, do Japão, deixará de desenvolver estações base 4G e 5G, mas continuará a…

3 horas atrás

As vendas anuais de chips Wi-Fi 6E e Wi-Fi 7 ultrapassaram os 40 bilhões de dólares.

A Research & Markets estima que o mercado global de chips Wi-Fi 6E e Wi-Fi…

5 horas atrás