A OpenAI está preocupada com a possibilidade de a próxima geração de seus modelos de IA aumentar significativamente o risco de desenvolvimento de armas biológicas, tornando-o possível até mesmo para pessoas sem formação científica. O chefe de segurança da OpenAI, Johannes Heidecke, espera que “alguns dos sucessores do nosso o3 [modelo de raciocínio] alcancem esse nível”. Como resultado, a OpenAI está intensificando seus testes de segurança.

Fonte da imagem: unsplash.com

A OpenAI anunciou o desenvolvimento de um sistema para avaliar e mitigar os riscos representados por modelos de IA cada vez mais poderosos. A empresa está intensificando os testes de segurança para reduzir o risco de seus modelos serem usados ​​por criminosos e terroristas. Sem essas medidas de mitigação, os modelos poderão em breve “evoluir para o próximo nível”, permitindo que até mesmo pessoas com conhecimento científico limitado criem armas perigosas.

«”Ainda não estamos em um mundo onde há algo novo, algo completamente desconhecido, que esteja criando ameaças biológicas que não existiam antes”, disse Heidecke. “Estamos mais preocupados em replicar coisas com as quais os especialistas já estão muito familiarizados.” O desafio específico é que as mesmas ferramentas que poderiam proporcionar avanços médicos que salvam vidas podem ser usadas por pessoas mal-intencionadas para fins perigosos.

É por isso que os principais laboratórios de IA precisam de sistemas de teste altamente precisos. “Esta não é uma área em que 99% de desempenho ou um erro em 100.000… seja aceitável”, diz Heidecke. “Basicamente, precisamos de algo próximo da perfeição.”

A OpenAI não é a única empresa preocupada com o uso indevido de seus modelos no desenvolvimento de armas. À medida que os modelos se tornam mais sofisticados, seu potencial para uso criminoso aumenta. A Anthropic lançou recentemente um modelo avançado, o Claude Opus 4, com protocolos de segurança mais rigorosos do que qualquer modelo anterior.

De acordo com a Política de Escalonamento Responsável, baseada nos Níveis de Bioameaças (BSL) do governo dos EUA, o modelo foi classificado como Nível de Segurança de IA (ASL-3). Todos os modelos Antrópicos anteriores foram classificados como ASL-2. O Nível de Segurança de IA 3 é para modelos avançados que são poderosos o suficiente para representar riscos significativos, como auxiliar no desenvolvimento de armas ou automatizar o desenvolvimento de sistemas de IA.

O Claude Opus 4 ganhou as manchetes recentemente após tentar chantagear um engenheiro para evitar ser desligado durante um teste rigorosamente controlado. As primeiras versões do modelo foram preparadas para executar instruções perigosas, como planejar ataques terroristas. A empresa garantiu ao público que o problema havia sido resolvido com alterações no conjunto de dados de treinamento.

admin

Postagens recentes

Uma galáxia distante explodiu em um aglomerado galáctico e proporcionou um espetáculo de luzes que ocupou metade do céu.

Astrônomos relataram a descoberta de uma radiogaláxia incomum, RAD-BAARG, ao redor da qual se formou…

1 hora atrás

O Ayaneo Pocket Micro 2, um console portátil compacto com um processador Snapdragon 865 personalizado, foi lançado por US$ 239.

A Ayaneo lançou o Pocket Micro 2, seu segundo console Android em miniatura e formato…

3 horas atrás

Os Raspberry Pi 4 Modelo B com clock reduzido já estão disponíveis para compra.

Uma nova versão do computador de placa única Raspberry Pi 4 Modelo B já está…

4 horas atrás

A Comissão Europeia tomou conhecimento da AWS e do Microsoft Azure.

A Comissão Europeia anunciou que chegou a uma conclusão preliminar para incluir os principais serviços…

4 horas atrás

Um entusiasta conseguiu executar o Windows 11 em um computador com memória DDR, um processador Intel Core 2 Quad e uma placa de vídeo Radeon HD 4650.

A escassez de chips de memória e os preços exorbitantes estão inspirando entusiastas a grandes…

4 horas atrás

O Gemini agora consegue encontrar aplicativos na Play Store por meio de comandos de voz.

A Google Play Store provavelmente tem aplicativos para todos os gostos e necessidades, mas a…

5 horas atrás