A Anthropic pagará até US$ 15.000 a hackers que encontrarem vulnerabilidades em seus sistemas de IA

A Anthropic anunciou o lançamento de um programa expandido de caça a vulnerabilidades, oferecendo a especialistas terceirizados em segurança cibernética até US$ 15.000 em recompensas pela identificação de problemas críticos em seus sistemas de inteligência artificial.

Fonte da imagem: Copiloto

A iniciativa visa encontrar “técnicas de evasão universais”, isto é, técnicas de hacking que possam contornar consistentemente as medidas de segurança da IA ​​em áreas de alto risco, como ameaças químicas, biológicas, radiológicas e nucleares, bem como no domínio cibernético. De acordo com a VentureBeat, a Anthropic convidará hackers éticos para testar seu sistema antes de seu lançamento público, para evitar imediatamente possíveis explorações que possam levar ao abuso de seus sistemas de IA.

Curiosamente, esta abordagem difere das estratégias de outros grandes intervenientes no campo da IA. Por exemplo, OpenAI e Google têm programas de recompensas, mas concentram-se mais em vulnerabilidades de software tradicionais do que em explorações específicas da indústria de IA. Além disso, a Meta✴ foi recentemente criticada por sua posição relativamente velada em relação à pesquisa de segurança de IA. Pelo contrário, o foco claro da Anthropic na abertura estabelece um novo padrão de transparência nesta questão.

No entanto, a eficácia dos programas de verificação de vulnerabilidades na abordagem de toda a gama de problemas de segurança da IA ​​permanece controversa. Os especialistas observam que poderá ser necessária uma abordagem mais abrangente, incluindo testes extensivos, melhor interpretabilidade e talvez novas estruturas de governação necessárias para garantir que os sistemas de IA se alinham globalmente com os valores humanos.

O programa começa como uma iniciativa apenas para convidados (testes fechados) em parceria com a renomada plataforma HackerOne, mas no futuro a Anthropic planeja expandir o programa, tornando-o aberto e criando um modelo independente separado para colaboração da indústria em segurança de IA.

avalanche

Postagens recentes

A Nvidia lançou uma atualização de driver para corrigir travamentos em Arknights: Endfield.

A Nvidia lançou a versão 596.02 do driver de correção (hotfix). Ela é baseada no…

38 minutos atrás

Um horror ancestral desperta no trailer de jogabilidade de Cthulhu: The Cosmic Abyss, um jogo de terror e investigação baseado nas obras de H.P. Lovecraft.

A desenvolvedora Big Bad Wolf, com o apoio da Nacon, revelou um trailer de jogabilidade…

1 hora atrás

A MaxSun apresentou suas variantes do Arc Pro B70, com resfriamento ativo e passivo.

A MaxSun tornou-se a primeira parceira da Intel a anunciar suas variantes da placa gráfica…

2 horas atrás

A ASRock apresentou a placa-mãe Z890 Taichi 10th Anniversary com um design atualizado.

A ASRock apresentou a placa-mãe Z890 Taichi 10th Anniversary, projetada para celebrar o 10º aniversário…

3 horas atrás

Uma fonte confiável revelou o principal jogo da PS Plus de abril uma semana antes do anúncio oficial.

Devido a restrições de calendário, a lista de jogos de abril para assinantes da PlayStation…

3 horas atrás