Categorias: Mercado de tecnologia e TI. notíciaVírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

Um engenheiro da Microsoft encontrou uma vulnerabilidade séria no artista de IA DALL-E 3, mas a empresa manteve o assunto em segredo

O engenheiro sênior de inteligência artificial da Microsoft, Shane Jones, descobriu uma vulnerabilidade no gerador de imagens OpenAI DALL-E 3 que permite contornar os mecanismos de segurança da rede neural e gerar conteúdo impróprio. Mas a Microsoft e a OpenAI negaram a existência desta vulnerabilidade e impediram que o problema se tornasse público.

Fonte da imagem: efes / pixabay.com

O engenheiro explicou que decidiu divulgar o problema depois que uma série de imagens fotorrealistas geradas por IA da famosa performer Taylor Swift, de natureza sensível, foram publicadas nas redes sociais na semana passada. O incidente causou indignação entre seus fãs, e Shane Jones pediu à OpenAI que retirasse o DALL-E 3 do acesso público. De acordo com uma versão, os atacantes que criaram esta série de imagens utilizam a ferramenta Microsoft Designer, parcialmente baseada neste gerador de IA. O engenheiro também enviou uma carta a dois senadores, um membro da Câmara dos Representantes e o Procurador-Geral do Estado de Washington, observando que “a Microsoft estava ciente dessas vulnerabilidades e do potencial de abuso”.

Jones informou à Microsoft sobre o problema que descobriu em 1º de dezembro de 2023, enviando a solicitação correspondente por meio do sistema interno da empresa. No mesmo dia, recebeu resposta de um funcionário que trabalhava com tais solicitações, que observou que o problema não dizia respeito nem à rede interna da Microsoft nem às contas de clientes da empresa, e recomendou o envio de sua solicitação à OpenAI. O engenheiro enviou no dia 9 de dezembro, fornecendo informações detalhadas sobre a vulnerabilidade, mas nunca recebeu resposta. Jones continuou a estudar o problema e “concluiu que o DALL-E 3 representa uma ameaça à segurança pública e deve ser removido do acesso público até que a OpenAI possa eliminar os riscos associados a este modelo”.

Fonte da imagem: ilgmyzin / unsplash.com

Duas semanas depois, no dia 14 de dezembro, o engenheiro tornou pública a conversa postando um post em sua página do LinkedIn pedindo a retirada do DALL-E 3 do mercado. Ele notificou a direção da empresa sobre isso, e seu superior imediato o contatou rapidamente – ele afirmou que o departamento jurídico da Microsoft exigia que a publicação fosse removida imediatamente e que ele apresentaria os motivos de sua demanda posteriormente. Jones excluiu a postagem, mas nunca recebeu qualquer comunicação dos advogados da Microsoft. Como resultado, em 30 de janeiro ele foi forçado a enviar uma carta às autoridades.

A OpenAI respondeu apenas em 30 de janeiro, afirmando que examinou o pedido do engenheiro imediatamente após seu recebimento, e o método que ele descreveu supostamente não permitia contornar as medidas de segurança. “A segurança é a nossa prioridade e estamos adotando uma abordagem multifacetada. No modelo fundamental DALL-E 3, desenvolvemos um filtro para o conteúdo mais explícito de seus dados de treinamento, incluindo imagens sexuais e violentas, e desenvolvemos classificadores de imagens robustos para evitar que o modelo produzisse imagens prejudiciais. Também implementamos medidas de segurança adicionais para nossos produtos, ChatGPT e API DALL-E, incluindo a rejeição de solicitações contendo o nome de uma figura pública. Identificamos e rejeitamos imagens que violem nossas políticas e filtramos todas as imagens geradas antes de serem mostradas ao usuário. Para fortalecer nossas medidas de segurança e verificar se há abusos, estamos contratando uma equipe de especialistas terceirizados”, garantiu OpenAI.

avalanche

Próximo O aplicativo Sberbank retornou à App Store com o nome “Accounting Online” »

Anterior « A Samsung revelou acidentalmente todas as características da pulseira inteligente Galaxy Fit3 – seu anúncio é esperado nos próximos dias

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

Processadores

A Qualcomm espera faturar US$ 15 bilhões por ano com a venda de chips para servidores até 2029.

O relatório trimestral da Qualcomm veio acompanhado do anúncio dos processadores de servidor Dragonfly C1000,…

24 minutos atrás

O mundo da robótica

Uma versão reforçada do cão robô chinês Lynx M20S escalou encostas de montanhas em temperaturas de -30 graus.

A empresa chinesa DEEP Robotics demonstrou a incrível resistência e capacidade de transposição de terrenos…

6 horas atrás

Simulador

O aclamado simulador de sobrevivência DayZ ganhará uma sequência – a Bohemia Interactive anunciou oficialmente DayZ 2.

Os desenvolvedores do estúdio tcheco Bohemia Interactive confirmaram o desenvolvimento de uma sequência para o…

8 horas atrás

Desenvolvimento e fabricação de eletrônicos

Em busca de férmions de Majorana: cientistas questionam novamente a tecnologia de computação quântica da Microsoft.

Uma nova crítica publicada na revista científica Nature levanta questões sobre o avanço da computação…

8 horas atrás

Carros, motos, veículos

A Zoox atualizou seu serviço de robotáxis, com o lançamento do transporte público pago previsto para o final do ano.

A Zoox, empresa pertencente à Amazon, atualizou o design de seu robotáxi especializado. A Zoox…

10 horas atrás

Jogos

Warhammer 40.000: Rogue Trader atingiu um novo pico de vendas e chegará ao formato físico pela primeira vez.

Após o fracasso do Owlcat Launcher, a Owlcat Games anunciou o sucesso de seu jogo…

11 horas atrás