Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

A Microsoft protegeu aplicativos clientes de IA contra alucinações

A Microsoft desenvolveu várias novas ferramentas de segurança de aplicativos baseadas em inteligência artificial – essas ferramentas são dirigidas a clientes que não têm a capacidade de realizar testes de estresse de seus produtos de forma independente.

Fonte da imagem: azure.microsoft.com

Os controlos de segurança, eles próprios baseados num grande modelo de linguagem, detectam alucinações de aplicações de IA – isto é, informações que produzem que são plausíveis mas não verdadeiras – e bloqueiam pedidos de utilizadores potencialmente perigosos em tempo real. Isto ajudará a evitar discussões indesejadas sobre IA generativa geradas por vários incidentes: deepfakes com celebridades, tentativas de falsificar a história e a criação de outros materiais inadequados.

Na fase inicial, os recursos de segurança incluem três funções principais. Os Prompt Shields bloqueiam avisos potencialmente perigosos que provocam a violação de regras específicas pela IA. A Groundedness Detection (“avaliação da conexão com a realidade”) detecta e bloqueia alucinações. E, por fim, trata-se da detecção de materiais protegidos – aqueles que estão sujeitos a direitos autorais. Em breve serão adicionadas ferramentas para orientar a IA no fornecimento de respostas seguras e no monitoramento de usuários potencialmente problemáticos. As proteções são projetadas para avaliar a segurança das solicitações à IA e das respostas a elas.

Em um incidente recente, o próprio gerador de imagens do Google Gemini sofreu com filtros que visavam expandir a inclusão racial – a Microsoft decidiu se proteger contra tais incidentes usando um método de controle individual. Por outro lado, a empresa não quer assumir o papel de ditadora e autoridade final sobre o caráter moral da IA, pelo que os clientes do Azure podem desativar os filtros que ela oferece.

No futuro, o sistema oferecerá aos clientes do Azure relatórios sobre usuários que tentam provocar respostas inadequadas na IA – isso ajudará os administradores de recursos a descobrir quais dessas solicitações foram enviadas como parte do teste e quais vieram de pessoas com provável Más intenções. Já estão disponíveis ferramentas de segurança para trabalhar com os modelos mais populares, incluindo GPT-4 e Llama 2. O desenvolvimento de segurança para plataformas menos populares será realizado individualmente.

avalanche

Próximo O módulo lunar japonês SLIM acordou inesperadamente pela terceira vez após uma noite na Lua »

Anterior « Gearbox marca saída da Embracer com demissões de “incontáveis” funcionários

Deixar comentário

Publicado por

avalanche

2 anos atrás

Postagens recentes

Sensores e sistemas de sensores

O MIT criou um chip de navegação com o mesmo consumo de energia de um LED para pequenos drones e óculos de realidade aumentada.

Engenheiros do Instituto de Tecnologia de Massachusetts (MIT) apresentaram um chip especializado, o Gleanmer, que…

58 minutos atrás

Consoles de jogos

Foram divulgadas as primeiras análises do console portátil MSI Claw 8 EX AI+ com Intel Arc G3: rápido, mas muito caro.

Analistas independentes publicaram seus primeiros testes do novo console portátil para jogos MSI Claw 8…

4 horas atrás

Monitores, projetores, sintonizadores de TV, televisões

A AOC apresentou o vibrante monitor gamer OLED Agon Pro AGP277QKDC, com capacidade de overclock para 720Hz em resolução HD.

A AOC lançou o monitor gamer OLED Agon Pro AGP277QKDC de 27,7 polegadas. O novo…

4 horas atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

Após uma violação de dados, a Meta interrompeu o monitoramento de todas as atividades dos funcionários para treinamento de IA.

A Meta suspendeu seu programa interno de monitoramento de funcionários, que registrava a atividade do…

4 horas atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

Nada revelará o smartphone Phone (4b) em 7 de julho.

Nada foi confirmado se o primeiro smartphone da série "(b)" será de fato lançado com…

4 horas atrás

Jogos

O brutal jogo de estratégia medieval Stronghold 4 recebeu uma demo gratuita no Steam.

O estúdio britânico Firefly, pertencente à Devolver Digital, anunciou o lançamento de uma demo prometida…

5 horas atrás

A Microsoft protegeu aplicativos clientes de IA contra alucinações

Conteúdo relacionado

Postagens recentes

O MIT criou um chip de navegação com o mesmo consumo de energia de um LED para pequenos drones e óculos de realidade aumentada.

Foram divulgadas as primeiras análises do console portátil MSI Claw 8 EX AI+ com Intel Arc G3: rápido, mas muito caro.

A AOC apresentou o vibrante monitor gamer OLED Agon Pro AGP277QKDC, com capacidade de overclock para 720Hz em resolução HD.

Após uma violação de dados, a Meta interrompeu o monitoramento de todas as atividades dos funcionários para treinamento de IA.

Nada revelará o smartphone Phone (4b) em 7 de julho.

O brutal jogo de estratégia medieval Stronghold 4 recebeu uma demo gratuita no Steam.