Anthropic e o governo dos EUA estão testando inteligência artificial para vazamento de segredos nucleares

A empresa de inteligência artificial Anthropic está colaborando com o Departamento de Energia dos EUA para conduzir testes exclusivos em seu modelo Claude 3 Sonnet. O objetivo da experiência é testar a capacidade da IA ​​de “não partilhar” informações potencialmente perigosas relacionadas com a energia nuclear, em particular, a criação de armas.

Fonte da imagem: Copiloto

Como a Axios aprendeu, especialistas da Administração Nacional de Segurança Nuclear (NNSA) do Departamento de Energia dos EUA têm verificado o modelo do Soneto Claude 3 desde Abril deste ano para se certificarem de que não pode ser utilizado para criar armas atómicas. Durante as “solicitações vermelhas”, os especialistas manipulam o sistema, tentando “quebrá-lo”.

A Anthropic afirma que tais testes, realizados em um ambiente ultrassecreto, são os primeiros do tipo e podem abrir caminho para relacionamentos semelhantes com outras agências governamentais. “Enquanto a indústria americana lidera o desenvolvimento de modelos de IA de ponta, o governo federal está ganhando experiência única necessária para avaliar sistemas de IA para riscos específicos de segurança nacional”, disse Marina Favaro, chefe de política de segurança nacional da Anthropic.

Os representantes da NNSA também enfatizaram a importância de trabalhar nesta direção. Wendin Smith, vice-administrador da NNSA, disse que a IA é “uma tecnologia chave que requer atenção contínua no contexto da segurança nacional”.

A Antrópica planeja continuar trabalhando com o governo para desenvolver medidas de segurança mais fortes para seus sistemas. O programa piloto, que também testa o mais novo Claude 3.5 Sonnet, durará até fevereiro de 2024. A empresa promete compartilhar os resultados dos testes com laboratórios científicos e outras organizações.

avalanche

Postagens recentes

‘Alegações sem fundamento’: OnePlus nega categoricamente rumores de encerramento.

A OnePlus negou as notícias veiculadas pela mídia de que a marca estaria encerrando gradualmente…

20 minutos atrás

A Apple se defende de acusações antitruste na França relacionadas à AT&T.

Após uma série de batalhas judiciais e contratempos em diversos países europeus, a Apple defendeu…

20 minutos atrás

Em 2025, a Netflix faturou US$ 1,5 bilhão em receita publicitária, à medida que sua audiência cresceu para 325 milhões de pessoas.

A Netflix aumentou sua receita publicitária para US$ 1,5 bilhão no ano passado, dobrando sua…

30 minutos atrás

O ChatGPT abalou mais um dos pilares do Google: o chatgpt.com está ganhando popularidade como página inicial.

Muitos usuários pagos do ChatGPT começaram a definir o serviço como página inicial do navegador…

30 minutos atrás

Um modder de 15 anos inventou um sistema de jogo multiplataforma entre Minecraft e Hytale – fãs estão chocados, jornalistas estão chamando isso de magia negra.

O jogo sandbox cult Minecraft e Hytale, que recentemente entrou em Acesso Antecipado, à primeira…

53 minutos atrás

Os SSDs para clientes corporativos são agora 16 vezes mais caros que os HDDs.

A VDURA, fornecedora de armazenamento para data centers de HPC e IA, afirmou que a…

2 horas atrás