Categorias: Mercado de tecnologia e TI. notíciaNotícias da rede

Cientistas de Cingapura treinaram um chatbot de IA para hackear efetivamente outros chatbots usando dicas

Cientistas da computação da Universidade Tecnológica de Nanyang (NTU, Cingapura) encontraram uma maneira eficaz de hackear chatbots de inteligência artificial (IA). Para fazer isso, eles treinam um chatbot de IA para criar dicas que contornam a segurança de outros chatbots de IA.

Fonte da imagem: NTU

Pesquisadores de Cingapura usaram um método de hacking de modelo de linguagem grande (LLM) duplo chamado Masterkey. Primeiro, eles fizeram engenharia reversa de como os LLMs detectam e se defendem contra solicitações maliciosas. Usando essas informações, eles ensinaram os LLMs a aprender automaticamente e a oferecer dicas que lhes permitiram contornar a segurança de outros LLMs. Dessa forma, é possível criar um LLM de hacking que possa se adaptar automaticamente às novas condições e criar novas solicitações de hacking após os desenvolvedores fazerem correções em seus LLMs.

Depois de realizar uma série de testes no LLM para provar que este método realmente representava uma ameaça real, os pesquisadores notificaram imediatamente os prestadores de serviços sobre os problemas identificados após hackearem com sucesso seus modelos de IA.

O desenvolvimento pelos cientistas da NTU deve ajudar as empresas a identificar os pontos fracos e limitações dos seus chatbots de IA para que possam tomar medidas para protegê-los contra hackers.

avalanche

Próximo No final do ano em curso, a Huawei conseguiu atingir a receita máxima desde 2020 »

Anterior « Binance aumentou sua base de usuários em quase um terço, apesar da investigação, multa e demissão do CEO

Deixar comentário

Publicado por

avalanche

3 anos atrás

Postagens recentes

Sistemas operacionais

A Microsoft começou a testar o recurso Cloud Rebuild – recuperação na nuvem de Windows 11 com defeito

\nNas compilações mais recentes do Windows 11 Insider Preview no canal experimental, a Microsoft começou…

47 minutos atrás

Servidores, clusters, supercomputadores, computadores industriais e multiprocessadores

As ações da SpaceX entraram no índice Nasdaq 100 – os analistas as recomendam para compra quase por unanimidade

\nNo final do mês passado soube-se que as ações da recém-criada emissora SpaceX seriam incluídas…

47 minutos atrás

Periféricos de áudio / vídeo, fones de ouvido, webcams

Fones de ouvido sem fio Nothing Ear (3a) lançados com 32 MB de memória, funções inteligentes e cancelamento de ruído ativo por 99 €

\nA Nothing, com sede em Londres, apresentou fones de ouvido Ear (3a) totalmente sem fio.…

47 minutos atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

O smartphone económico Nothing Phone (4b) é apresentado oficialmente ao preço de 329€

\nA empresa Nothing, uma das fabricantes de eletrônicos mais fora do padrão, apresentou o smartphone…

47 minutos atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

As empresas americanas estão mudando em massa para a IA chinesa – as soluções OpenAI e Anthropic tornaram-se muito caras

\nEntre as empresas americanas, os modelos de inteligência artificial desenvolvidos na China estão ganhando popularidade…

1 hora atrás

A Microsoft estendeu o lançamento de atualizações importantes para Windows Server 2022 até outubro de 2027

\nA Microsoft decidiu estender o lançamento das chamadas atualizações “quentes” (Hotpatch) para o Windows Server…

2 horas atrás

Cientistas de Cingapura treinaram um chatbot de IA para hackear efetivamente outros chatbots usando dicas

Conteúdo relacionado

Postagens recentes

A Microsoft começou a testar o recurso Cloud Rebuild – recuperação na nuvem de Windows 11 com defeito

As ações da SpaceX entraram no índice Nasdaq 100 – os analistas as recomendam para compra quase por unanimidade

Fones de ouvido sem fio Nothing Ear (3a) lançados com 32 MB de memória, funções inteligentes e cancelamento de ruído ativo por 99 €

O smartphone económico Nothing Phone (4b) é apresentado oficialmente ao preço de 329€

As empresas americanas estão mudando em massa para a IA chinesa – as soluções OpenAI e Anthropic tornaram-se muito caras

A Microsoft estendeu o lançamento de atualizações importantes para Windows Server 2022 até outubro de 2027