Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

As pessoas em breve deixarão de entender como a IA funciona, alertam os principais desenvolvedores

Cerca de cinquenta especialistas renomados na área de inteligência artificial, incluindo engenheiros da OpenAI, Google DeepMind e Anthropic, publicaram os resultados de um estudo segundo o qual uma pessoa pode em breve perder a capacidade de seguir as cadeias de raciocínio de grandes modelos de linguagem.

Fonte da imagem: Igor Omilaev/unsplash.com

Modelos de IA baseados na arquitetura Transformer não podem prescindir da construção de cadeias de raciocínio ao resolver problemas complexos. Para transitar entre as camadas da rede neural, esses raciocínios devem assumir a forma de texto legível por humanos. Pesquisadores designaram essa característica como uma propriedade de raciocínio externalizada. Ao executar tarefas bastante complexas, o modelo recorre a um formato de texto como memória de trabalho. Se a IA utilizar linguagem humana para isso, o desenvolvedor mantém a capacidade de ler seus “pensamentos”.

Essas cadeias incluem raciocínio bastante explícito. Nesse caso, o modelo pode admitir hacking ou sabotagem, o que ajuda os pesquisadores a detectar tentativas de comportamento inadequado da IA. Além da forte necessidade de “pensar em voz alta” ao lidar com problemas complexos, o modelo também pode ter sua própria tendência a raciocinar abertamente, tendência que pode desaparecer quando o mecanismo de aprendizagem muda. Por exemplo, quando o aprendizado por reforço é ampliado, o modelo pode mudar de uma linguagem clara para uma linguagem própria.

Este problema não pode ser resolvido à força – a IA pode começar a fingir que se comporta decentemente, mas ocultar a verdadeira situação. Há outra opção – o raciocínio do modelo em um espaço matemático oculto, que fornece à IA melhores resultados, mas não será mais possível ler tal raciocínio. Há exemplos em que o Anthropic Claude 4 Opus tentou chantagear uma pessoa, e o OpenAI o3 sabotou comandos de desligamento.

Para abordar essas questões, os autores do estudo propõem o desenvolvimento de métodos padrão para avaliar a capacidade de monitorar a IA, publicar resultados e implementar modelos com transparência. Isso é mais importante do que a corrida pelo desempenho, apontam os pesquisadores.

admin

Próximo 50 GB em 1,5 segundos: China testa rede celular 6G »

Anterior « DDR5 barato ainda não chegou: CXMT chinesa adia lançamento da produção em massa de chips DDR5

Deixar comentário

Publicado por

admin

11 meses atrás

Postagens recentes

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

A China criou um análogo do Mito Antrópico – uma poderosa ferramenta de IA para encontrar vulnerabilidades e automatizar as defesas cibernéticas.

A empresa chinesa de segurança da informação 360 Security Technology anunciou a criação de uma…

22 minutos atrás

Jogos

Um detalhe muito apreciado pelos fãs de Batman: Arkham Knight foi revelado como sendo um bug 11 anos depois.

A imaginação dos jogadores muitas vezes trabalha mais do que a dos criadores de jogos.…

35 minutos atrás

Na vanguarda da ciência

A NASA descobriu um par de exoplanetas incríveis — mais leves que algodão-doce e na mesma órbita.

Exoplanetas com densidades extremamente baixas já são raros, mas encontrar dois deles na mesma órbita…

47 minutos atrás

Programas

A Meta vai transferir até 90% da moderação do Facebook, Instagram e Threads para IA.

A Meta✴Platforms surgiu originalmente da rede social Facebook✴ e, portanto, busca aplicar seus desenvolvimentos mais…

47 minutos atrás

Jogos

O clássico cult “King’s Bounty: Legend of the Knight” recebeu uma grande atualização com suporte a mods e conquistas em homenagem ao seu 18º aniversário.

A Fulqrum Publishing anunciou o lançamento de uma grande atualização técnica para o jogo de…

1 hora atrás

Processadores

O Reddit coletou estatísticas sobre falhas do Ryzen X3D no último ano: 70% das falhas ocorreram em placas-mãe ASRock.

Um usuário do Reddit realizou um pequeno estudo: utilizando um bot, ele lançou uma busca…