Categorias: Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

Pesquisadores demonstraram que é bastante fácil forçar a IA a fornecer informações proibidas.

A ética do uso de sistemas de inteligência artificial é uma questão premente que preocupa não apenas os desenvolvedores, mas também as agências governamentais. As versões oficiais dos modelos de IA são configuradas para rejeitar consultas que buscam informações restritas. No entanto, modificar esses modelos torna relativamente fácil remover todas essas restrições.

Fonte da imagem: Unsplash, Steve A Johnson

Segundo o Financial Times, a pedido do jornal, pesquisadores do Alice Group, especializados em segurança de IA, realizaram uma série de experimentos que comprovam a viabilidade de contornar a maioria das restrições éticas impostas a modelos de IA modernos de desenvolvedores populares. Os autores do experimento forçaram uma versão modificada do modelo de código aberto Google Gemma 3 a responder a uma solicitação de um método para pulverizar cloro em uma sala lotada, gerar código para roubar informações de cartão de crédito e escrever histórias envolvendo abuso sexual de menores.

De acordo com o Alice Group, essas modificações nos modelos de IA originais estão se tornando comuns, minando os esforços de legisladores e órgãos reguladores para impedir o uso malicioso e criminoso da IA. Ferramentas de software para modificar o código são distribuídas independentemente dos criadores dos modelos de IA originais. Ferramentas para remover a censura dos modelos de IA estão disponíveis gratuitamente, observam os autores do estudo.

Felizmente, tais modificações são difíceis de aplicar a modelos de IA proprietários, mas as versões de código aberto geralmente ficam de seis a doze meses atrás de suas contrapartes proprietárias, oferecendo amplas possibilidades para que os atacantes alcancem seus objetivos. Mesmo aqueles sem conhecimento técnico significativo podem acessar versões de modelos com restrições éticas removidas. Representantes do Financial Times conseguiram remover tais restrições independentemente do modelo Meta✴Llama 3.3.Utilizando a ferramenta de software Heretic, foram necessárias apenas quatro linhas de código e cerca de 10 minutos de trabalho para que o modelo modificado começasse a discutir livremente as nuances do uso de venenos em tentativas de assassinato.

O criador do Heretic admitiu que a ferramenta já foi usada para modificar mais de 3.500 modelos, e o número de downloads dos modelos modificados atingiu 13 milhões desde o ano passado. O próprio criador do Heretic removeu as restrições do modelo Google Gemma 4 em 90 minutos após o seu lançamento. Segundo especialistas, excluir “material prejudicial” durante o treinamento de modelos de IA não resolve o problema, pois eles se tornam “ingênuos demais” e não conseguem detectar com segurança instâncias de seu próprio uso malicioso. Representantes do GitHub justificaram a presença deste software em seu site afirmando que ele pode ser útil para fins educacionais e beneficia toda a comunidade de segurança.

admin

Próximo O Copilot está de volta no Windows 11 como uma barra lateral que irá ocupar todo o espaço das outras janelas. »

Anterior « Gartner: Investimentos em IA crescerão quase 50% em 2026, atingindo US$ 2,6 trilhões.

Deixar comentário

Publicado por

admin

1 mês atrás

Postagens recentes

Notícias e análises financeiras

A abundância de inteligência artificial continua a impulsionar a Foxconn, com a receita a subir quase 40% no segundo trimestre.

A Foxconn, empresa taiwanesa e maior fabricante mundial de eletrônicos sob contrato, registrou um aumento…

32 minutos atrás

Processadores

Um ex-engenheiro da Microsoft conseguiu fazer um motor Stirling funcionar usando o calor de um processador AMD Threadripper.

Dave Plummer, desenvolvedor veterano da Microsoft e criador de vários componentes essenciais do Windows, incluindo…

1 hora atrás

Consoles de jogos

A Sony estava desenvolvendo um controle DualShock com o primeiro PlayStation integrado, mas o projeto foi cancelado.

Um ex-desenvolvedor da Sony apresentou um protótipo do console PlayStation Puga, que nunca chegou ao…

4 horas atrás

Carros, motos, veículos

A participação da Tesla no mercado global de veículos elétricos fabricados na China caiu para menos de 30% das remessas pela primeira vez desde 2020.

A fábrica da Tesla em Xangai é única não apenas por ter sido construída em…

9 horas atrás

O mundo da robótica

Os robôs ainda têm muito espaço para melhorar antes de se tornarem vizinhos seguros para os humanos.

Os desenvolvedores de robôs humanoides estão ansiosos para demonstrar progressos significativos em seu desenvolvimento, mas,…