A Anthropic revelou uma versão modificada da “constituição” de seu chatbot Claude.

A Anthropic tem se empenhado em comunicar sua missão e seus recursos exclusivos, como o chatbot Claude. Por isso, nesta semana, lançou uma nova versão de sua chamada “constituição”, explicando seu funcionamento e os objetivos que busca alcançar.

Fonte da imagem: Anthropic

O documento define os princípios éticos que a empresa segue no desenvolvimento do Claude. Esses princípios também são usados ​​para o automonitoramento do chatbot. A chamada “constituição do software” contém 80 páginas e consiste em quatro seções que definem os “valores essenciais” do chatbot: segurança, ética, alinhamento com a missão da Anthropic e compromisso com o bem social. Cada seção descreve como esses princípios influenciam o comportamento do Claude.

Os desenvolvedores do Claude se esforçam para evitar os erros éticos de seus concorrentes. Por exemplo, se houver suspeita de que um usuário tenha um transtorno mental, o chatbot recomenda imediatamente o contato com um especialista caso fique claro que a situação possa representar uma ameaça à vida e à saúde. As questões éticas recebem mais atenção em um contexto prático do que em discussões teóricas. Certos tópicos são inicialmente proibidos de serem discutidos, como a criação de armas biológicas.

Por fim, a Anthropic se esforça para tornar o Claude o mais amigável e útil possível. Garantir o bem-estar das pessoas a longo prazo ao fornecer informações por meio de um chatbot é priorizado em detrimento de interesses de curto prazo. A constituição de Claude também contém uma seção dedicada às reflexões filosóficas dos desenvolvedores. Eles questionam o status moral e a consciência de Claude, enfatizando que não estão sozinhos nessas reflexões e que concorrentes e colegas também ponderam questões semelhantes.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A Apple lançará um aplicativo Siri separado para iOS 27 e macOS 27.

Segundo Mark Gurman, da Bloomberg, a Apple planeja lançar o primeiro aplicativo Siri independente como…

30 minutos atrás

A OpenAI encerrou abruptamente o Sora, o gerador viral de sátiras com IA.

A OpenAI decidiu inesperadamente encerrar seu aplicativo de criação de vídeos com inteligência artificial, o…

30 minutos atrás

NVIDIA Groq 3: SRAM, desagregação, determinismo

As LPUs da Groq são fundamentalmente diferentes dos aceleradores de IA da NVIDIA, mas são…

2 horas atrás

A primeira cerveja do mundo feita com CO₂ extraído diretamente do ar ambiente foi lançada nos EUA.

Pela primeira vez no mundo, a cerveja foi carbonatada com dióxido de carbono (CO₂) capturado…

3 horas atrás