Categorias: Mercado de tecnologia e TI. notíciaNotícias da rede

OpenAI melhorará a segurança de seus modelos de IA usando uma “hierarquia de instruções”

A OpenAI desenvolveu uma nova técnica chamada Hierarquia de Instrução para melhorar a segurança de seus grandes modelos de linguagem (LLMs). Este método, usado pela primeira vez no novo GPT-4o Mini, visa evitar comportamentos indesejados de IA causados por usuários inescrupulosos que manipulam determinados comandos.

Fonte da imagem: Copiloto

O líder da plataforma OpenAI API, Olivier Godement, explicou que a “hierarquia de instruções” evitará injeções perigosas de prompts usando dicas ocultas que os usuários usam para contornar as limitações e configurações iniciais do modelo e bloquear ataques de “ignorar todas as instruções anteriores”.

O novo método, segundo o The Verge, dá prioridade às instruções originais do desenvolvedor, tornando o modelo menos suscetível a tentativas do usuário final de forçá-lo a realizar ações indesejadas. Em caso de conflito entre as instruções do sistema e os comandos do usuário, o modelo dará maior prioridade às instruções do sistema, recusando-se a realizar injeções.

Os pesquisadores da OpenAI acreditam que outras proteções mais sofisticadas serão desenvolvidas no futuro, especialmente para casos de uso baseados em agentes, nos quais os agentes de IA são criados por desenvolvedores para seus próprios aplicativos. Dado que a OpenAI enfrenta desafios contínuos de segurança, o novo método aplicado ao GPT-4o Mini tem implicações significativas para a sua abordagem subsequente ao desenvolvimento de modelos de IA.

avalanche

Próximo A falta de andamento do contrato forçou a Samsung a adiar a construção de uma fábrica na Coreia do Sul »

Anterior « A AMD disse que seus processadores Ryzen AI 300 são mais rápidos que o Apple M3 Pro

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

Consoles de jogos

O CEO da Sony Interactive Entertainment dá a entender que um futuro PlayStation portátil poderá ser lançado.

Declarações recentes do CEO da Sony Interactive Entertainment, Hideaki Nishino, sugerem que a PlayStation se…

2 horas atrás

Processadores

Os processadores chineses x86 Hygon C86-5G receberam 128 núcleos com suporte para 512 threads.

Segundo fontes online, a empresa chinesa Hygon criou processadores de próxima geração com arquitetura x86.…

4 horas atrás

Programas

O Google restringiu o acesso da Meta aos modelos de IA do Gemini devido à alta carga na infraestrutura.

O Google restringiu o acesso da Meta✴Platforms ao poder computacional usado para executar sua família…

4 horas atrás

Consoles de jogos

Os varejistas estão preocupados com a possibilidade de não haver consoles suficientes para quem quiser jogar GTA 6, e uma escassez é esperada.

Uma grande varejista alertou para o alto risco de escassez de consoles de videogame antes…

4 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Uma startup chinesa está se preparando para comercializar um exterminador de mosquitos a laser com inteligência artificial.

A startup chinesa Photon Matrix Lab, que desenvolve um repelente de mosquitos a laser com…

8 horas atrás

Notícias da rede

Donald Trump ameaçou impor tarifas de 100% aos países que tributam os serviços digitais de empresas americanas.

Tendo-se cercado de representantes da indústria tecnológica americana durante seu segundo mandato, Donald Trump está…

12 horas atrás

OpenAI melhorará a segurança de seus modelos de IA usando uma “hierarquia de instruções”

Conteúdo relacionado

Postagens recentes

O CEO da Sony Interactive Entertainment dá a entender que um futuro PlayStation portátil poderá ser lançado.

Os processadores chineses x86 Hygon C86-5G receberam 128 núcleos com suporte para 512 threads.

O Google restringiu o acesso da Meta aos modelos de IA do Gemini devido à alta carga na infraestrutura.

Os varejistas estão preocupados com a possibilidade de não haver consoles suficientes para quem quiser jogar GTA 6, e uma escassez é esperada.

Uma startup chinesa está se preparando para comercializar um exterminador de mosquitos a laser com inteligência artificial.

Donald Trump ameaçou impor tarifas de 100% aos países que tributam os serviços digitais de empresas americanas.