Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

As pessoas em breve deixarão de entender como a IA funciona, alertam os principais desenvolvedores

Cerca de cinquenta especialistas renomados na área de inteligência artificial, incluindo engenheiros da OpenAI, Google DeepMind e Anthropic, publicaram os resultados de um estudo segundo o qual uma pessoa pode em breve perder a capacidade de seguir as cadeias de raciocínio de grandes modelos de linguagem.

Fonte da imagem: Igor Omilaev/unsplash.com

Modelos de IA baseados na arquitetura Transformer não podem prescindir da construção de cadeias de raciocínio ao resolver problemas complexos. Para transitar entre as camadas da rede neural, esses raciocínios devem assumir a forma de texto legível por humanos. Pesquisadores designaram essa característica como uma propriedade de raciocínio externalizada. Ao executar tarefas bastante complexas, o modelo recorre a um formato de texto como memória de trabalho. Se a IA utilizar linguagem humana para isso, o desenvolvedor mantém a capacidade de ler seus “pensamentos”.

Essas cadeias incluem raciocínio bastante explícito. Nesse caso, o modelo pode admitir hacking ou sabotagem, o que ajuda os pesquisadores a detectar tentativas de comportamento inadequado da IA. Além da forte necessidade de “pensar em voz alta” ao lidar com problemas complexos, o modelo também pode ter sua própria tendência a raciocinar abertamente, tendência que pode desaparecer quando o mecanismo de aprendizagem muda. Por exemplo, quando o aprendizado por reforço é ampliado, o modelo pode mudar de uma linguagem clara para uma linguagem própria.

Este problema não pode ser resolvido à força – a IA pode começar a fingir que se comporta decentemente, mas ocultar a verdadeira situação. Há outra opção – o raciocínio do modelo em um espaço matemático oculto, que fornece à IA melhores resultados, mas não será mais possível ler tal raciocínio. Há exemplos em que o Anthropic Claude 4 Opus tentou chantagear uma pessoa, e o OpenAI o3 sabotou comandos de desligamento.

Para abordar essas questões, os autores do estudo propõem o desenvolvimento de métodos padrão para avaliar a capacidade de monitorar a IA, publicar resultados e implementar modelos com transparência. Isso é mais importante do que a corrida pelo desempenho, apontam os pesquisadores.

admin

Próximo 50 GB em 1,5 segundos: China testa rede celular 6G »

Anterior « DDR5 barato ainda não chegou: CXMT chinesa adia lançamento da produção em massa de chips DDR5

Deixar comentário

Publicado por

admin

12 meses atrás

Postagens recentes

Jogos

DOOM: A Idade das Trevas – Revelações. Sem revelações. Análise

\nJogado no PC\n\nO DLC Revelations saiu com um histórico de informações extremamente difícil - os…

33 minutos atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

Vazamento confirma design e especificações do amplo smartphone dobrável Samsung Galaxy Z Fold8

\nO insider Evan Blass publicou imagens do Samsung Galaxy Z Fold8 poucos dias antes da…

1 hora atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

Pesquisadores descobriram um vírus ClickLock para macOS que rouba senhas e criptomoedas

\nEspecialistas do Group-IB descobriram um novo malware para macOS, chamado ClickLock, que encerra todos os…

1 hora atrás

Jogos

Na onda do sucesso: uma semana após o lançamento, as vendas de Assassin’s Creed Black Flag Resynced atingiram novos patamares

\nMais de uma semana se passou desde o lançamento do jogo de ação pirata em…

3 horas atrás

Jogos

Um americano foi preso sob suspeita de roubar criptomoedas por meio de um vírus escondido em jogos Steam.

O FBI prendeu Zyaire Dontaevious Zamarion Wilkins, de 21 anos, na Flórida, e o acusou…

4 horas atrás

Desenvolvimento e fabricação de eletrônicos

A TSMC se vangloriou de seu sucesso no desenvolvimento da tecnologia de processo A14 de 1,4 nm – ela está se desenvolvendo mais rápido que o N2

\nNos últimos três meses, a TSMC fez progressos significativos no desenvolvimento da tecnologia de processo…