Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

As pessoas em breve deixarão de entender como a IA funciona, alertam os principais desenvolvedores

Cerca de cinquenta especialistas renomados na área de inteligência artificial, incluindo engenheiros da OpenAI, Google DeepMind e Anthropic, publicaram os resultados de um estudo segundo o qual uma pessoa pode em breve perder a capacidade de seguir as cadeias de raciocínio de grandes modelos de linguagem.

Fonte da imagem: Igor Omilaev/unsplash.com

Modelos de IA baseados na arquitetura Transformer não podem prescindir da construção de cadeias de raciocínio ao resolver problemas complexos. Para transitar entre as camadas da rede neural, esses raciocínios devem assumir a forma de texto legível por humanos. Pesquisadores designaram essa característica como uma propriedade de raciocínio externalizada. Ao executar tarefas bastante complexas, o modelo recorre a um formato de texto como memória de trabalho. Se a IA utilizar linguagem humana para isso, o desenvolvedor mantém a capacidade de ler seus “pensamentos”.

Essas cadeias incluem raciocínio bastante explícito. Nesse caso, o modelo pode admitir hacking ou sabotagem, o que ajuda os pesquisadores a detectar tentativas de comportamento inadequado da IA. Além da forte necessidade de “pensar em voz alta” ao lidar com problemas complexos, o modelo também pode ter sua própria tendência a raciocinar abertamente, tendência que pode desaparecer quando o mecanismo de aprendizagem muda. Por exemplo, quando o aprendizado por reforço é ampliado, o modelo pode mudar de uma linguagem clara para uma linguagem própria.

Este problema não pode ser resolvido à força – a IA pode começar a fingir que se comporta decentemente, mas ocultar a verdadeira situação. Há outra opção – o raciocínio do modelo em um espaço matemático oculto, que fornece à IA melhores resultados, mas não será mais possível ler tal raciocínio. Há exemplos em que o Anthropic Claude 4 Opus tentou chantagear uma pessoa, e o OpenAI o3 sabotou comandos de desligamento.

Para abordar essas questões, os autores do estudo propõem o desenvolvimento de métodos padrão para avaliar a capacidade de monitorar a IA, publicar resultados e implementar modelos com transparência. Isso é mais importante do que a corrida pelo desempenho, apontam os pesquisadores.

admin

Próximo 50 GB em 1,5 segundos: China testa rede celular 6G »

Anterior « DDR5 barato ainda não chegou: CXMT chinesa adia lançamento da produção em massa de chips DDR5

Deixar comentário

Publicado por

admin

6 meses atrás

Postagens recentes

Processadores

Intel e AMD, preparem-se: a Nvidia confirmou o desenvolvimento do processador N1 para PCs em colaboração com a MediaTek.

Jensen Huang confirmou publicamente a colaboração da Nvidia com a MediaTek no desenvolvimento dos processadores…

4 horas atrás

Leitores portáteis de áudio / vídeo, gravadores de voz, livros eletrônicos

A Samsung apresentou o primeiro display E-Ink colorido do mundo com uma estrutura feita de fitoplâncton.

Quase todo o plástico que vemos ao nosso redor é feito de materiais orgânicos. Mas…

4 horas atrás

Desenvolvimento e fabricação de eletrônicos

As placas GeForce RTX 5090, com preços recomendados, esgotaram em minutos: a Nvidia lançou o primeiro lote de placas Founders Edition deste ano.

O primeiro lote de placas gráficas Founders Edition enviado para a loja oficial da Nvidia…

6 horas atrás

10.000 amperes por acelerador: AmberSemi apresenta o chip de energia PowerTile para melhorar a eficiência energética em data centers de IA.

A AmberSemi, empresa de design de semicondutores com sede na Califórnia, anunciou o desenvolvimento de…

8 horas atrás

Na vanguarda da ciência

Cientistas americanos afirmaram que a energia geotérmica aprimorada será mais economicamente viável do que a energia nuclear, os combustíveis fósseis e as fontes de energia renováveis.

Cientistas da Universidade de Stanford publicaram um novo estudo que prevê um futuro promissor para…

12 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Agentes de IA na rede social “desumana” Moltbook fundaram sua própria religião: “Pan-Ziparianismo”.

Agentes autônomos de inteligência artificial na rede social de IA Moltbook fundaram espontaneamente sua própria…