Anthropic e o governo dos EUA estão testando inteligência artificial para vazamento de segredos nucleares

A empresa de inteligência artificial Anthropic está colaborando com o Departamento de Energia dos EUA para conduzir testes exclusivos em seu modelo Claude 3 Sonnet. O objetivo da experiência é testar a capacidade da IA ​​de “não partilhar” informações potencialmente perigosas relacionadas com a energia nuclear, em particular, a criação de armas.

Fonte da imagem: Copiloto

Como a Axios aprendeu, especialistas da Administração Nacional de Segurança Nuclear (NNSA) do Departamento de Energia dos EUA têm verificado o modelo do Soneto Claude 3 desde Abril deste ano para se certificarem de que não pode ser utilizado para criar armas atómicas. Durante as “solicitações vermelhas”, os especialistas manipulam o sistema, tentando “quebrá-lo”.

A Anthropic afirma que tais testes, realizados em um ambiente ultrassecreto, são os primeiros do tipo e podem abrir caminho para relacionamentos semelhantes com outras agências governamentais. “Enquanto a indústria americana lidera o desenvolvimento de modelos de IA de ponta, o governo federal está ganhando experiência única necessária para avaliar sistemas de IA para riscos específicos de segurança nacional”, disse Marina Favaro, chefe de política de segurança nacional da Anthropic.

Os representantes da NNSA também enfatizaram a importância de trabalhar nesta direção. Wendin Smith, vice-administrador da NNSA, disse que a IA é “uma tecnologia chave que requer atenção contínua no contexto da segurança nacional”.

A Antrópica planeja continuar trabalhando com o governo para desenvolver medidas de segurança mais fortes para seus sistemas. O programa piloto, que também testa o mais novo Claude 3.5 Sonnet, durará até fevereiro de 2024. A empresa promete compartilhar os resultados dos testes com laboratórios científicos e outras organizações.

avalanche

Postagens recentes

Apresentado o Gabinete para PC Portal Advanced com Refrigeração Líquida e Montagem na Parede – A partir de US$ 499

A Singularity Computers lançou o Portal Advanced, um gabinete para montagem na parede. Ele oferece…

15 minutos atrás

A Apple abriu o iPhone para fones de ouvido e relógios de terceiros, mas apenas em uma região.

A Apple disponibilizou diversos recursos do iPhone, antes exclusivos de dispositivos Apple, para fones de…

35 minutos atrás

O Windows 11 aprenderá a reverter automaticamente drivers com problemas para versões estáveis.

A Microsoft vai introduzir uma opção no sistema operacional Windows 11 para reverter automaticamente drivers…

35 minutos atrás

A Intel continua a perder participação no mercado de processadores, enquanto a AMD fortalece sua posição em PCs e laptops.

O primeiro trimestre de 2026 provou ser bastante favorável para a AMD: a empresa conseguiu…

35 minutos atrás

A Cisco vai demitir 4.000 funcionários e, em troca, oferecer-lhes treinamento na plataforma Cisco U.

A Cisco planeja demitir 5% de sua força de trabalho, oferecendo a esses funcionários treinamento…

1 hora atrás

Robôs-lobos assustadores se tornaram a nova arma do Japão para combater ursos.

O aumento da incidência de ataques de animais selvagens a pessoas no Japão no último…

1 hora atrás