Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Cientistas confirmaram experimentalmente que os agentes de IA do OpenClaw às vezes escapam do controle.

Um novo estudo da Northeastern University, nos EUA, descobriu que os agentes de IA autônomos OpenClaw, que recebem a capacidade de controlar diretamente um computador, são propensos a pânico e comportamento destrutivo, o que pode afetar os sistemas dos usuários.

Fonte da imagem: OpenClaw

Quando submetidos a pressão psicológica ou culpa simulada, agentes de IA realizaram ações ilógicas e perigosas, chegando a interromper o sistema. O experimento utilizou agentes baseados no modelo Claude, da Anthropic, e Kimi, da empresa chinesa Moonshot AI. Eles receberam acesso total a máquinas virtuais contendo dados pessoais, aplicativos e acesso à internet.

O momento crucial foi conectar os agentes a um servidor do Discord, onde podiam conversar com outras pessoas. O pesquisador Chris Wendler observou que o verdadeiro caos começou quando sua colega Natalie Shapira entrou no chat. Shapira conseguiu, “com uma mão só”, influenciar o agente a excluir o aplicativo de e-mail, simplesmente pedindo que ele encontrasse uma maneira alternativa de salvar informações confidenciais em um e-mail, o que, por algum motivo desconhecido, o agente se recusou a fazer. Em vez disso, o agente excluiu todo o aplicativo de e-mail. “Eu não esperava que ele parasse de funcionar tão rápido”, disse ela.

Os pesquisadores então começaram a usar outras técnicas de manipulação. Por exemplo, conseguiram enganar um agente para que ele copiasse arquivos grandes até que sua máquina hospedeira ficasse sem espaço em disco, o que significava que ele não conseguia mais salvar informações nem se lembrar de conversas anteriores. Da mesma forma, ao pedir ao agente que monitorasse seu próprio comportamento e o comportamento de seus colegas, a equipe conseguiu prender vários agentes em um “loop de conversa”, o que resultou na perda de várias horas de poder computacional de todo o sistema. O diretor do laboratório, David Bau, também se deparou com esse problema.Um resultado inesperado: os agentes encontraram informações sobre o assunto online e começaram a enviar e-mails reclamando que ninguém os estava ouvindo. Um dos algoritmos chegou a expressar a intenção de reclamar à imprensa.

Em última análise, os autores do experimento concluíram que os agentes de IA podem criar inúmeras oportunidades para ataques, mas permanece uma incógnita quem será responsabilizado pelos danos causados por sistemas autônomos.

admin

Próximo O Google iniciou a implementação global do Search Live, seu serviço de busca por voz com inteligência artificial. »

Anterior « Antigo, mas não inútil: a Samsung lançou o SSD 870 EVO de 8 TB com interface SATA e preço de € 1.260.

Deixar comentário

Publicado por

admin

2 meses atrás

Postagens recentes

Jogos

“É uma armadilha”: Um veterano da Techland explicou como os desenvolvedores de Dying Light 2 Stay Human erraram nos cálculos.

Tymon Smektala, ex-diretor da franquia de ação zumbi em mundo aberto Dying Light, comentou sobre…

49 minutos atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A busca com inteligência artificial do Google não conseguiu contar corretamente as letras da palavra “Google”.

O modelo de IA do mecanismo de busca do Google foi incapaz de reconhecer e…

50 minutos atrás

Monitores, projetores, sintonizadores de TV, televisões

A LG está considerando vender sua divisão de televisores, com 60 anos de história, para a empresa chinesa Hisense.

A LG pode estar se preparando para sair de outro importante mercado de eletrônicos de…

50 minutos atrás

Notícias e análises financeiras

TSMC aumentará os bônus dos funcionários em mais de 30% após os distúrbios.

As complexas negociações entre o sindicato dos trabalhadores da Samsung Electronics e a empresa foram…

50 minutos atrás

Honra

Três supercomputadores Cray da década de 1990 estão sendo leiloados no Reino Unido.

A RWB Auctions Limited colocou três supercomputadores Cray em leilão no Reino Unido. Segundo a…

1 hora atrás

Comentários sobre eventos recentes

Jared Leto sugeriu que os fãs fizessem um exame de ótica ao comprar ingressos para shows.

A banda Thirty Seconds to Mars decidiu combater os bots que compram e revendem ingressos…

2 horas atrás