A Anthropic revelou uma versão modificada da “constituição” de seu chatbot Claude.

A Anthropic tem se empenhado em comunicar sua missão e seus recursos exclusivos, como o chatbot Claude. Por isso, nesta semana, lançou uma nova versão de sua chamada “constituição”, explicando seu funcionamento e os objetivos que busca alcançar.

Fonte da imagem: Anthropic

O documento define os princípios éticos que a empresa segue no desenvolvimento do Claude. Esses princípios também são usados ​​para o automonitoramento do chatbot. A chamada “constituição do software” contém 80 páginas e consiste em quatro seções que definem os “valores essenciais” do chatbot: segurança, ética, alinhamento com a missão da Anthropic e compromisso com o bem social. Cada seção descreve como esses princípios influenciam o comportamento do Claude.

Os desenvolvedores do Claude se esforçam para evitar os erros éticos de seus concorrentes. Por exemplo, se houver suspeita de que um usuário tenha um transtorno mental, o chatbot recomenda imediatamente o contato com um especialista caso fique claro que a situação possa representar uma ameaça à vida e à saúde. As questões éticas recebem mais atenção em um contexto prático do que em discussões teóricas. Certos tópicos são inicialmente proibidos de serem discutidos, como a criação de armas biológicas.

Por fim, a Anthropic se esforça para tornar o Claude o mais amigável e útil possível. Garantir o bem-estar das pessoas a longo prazo ao fornecer informações por meio de um chatbot é priorizado em detrimento de interesses de curto prazo. A constituição de Claude também contém uma seção dedicada às reflexões filosóficas dos desenvolvedores. Eles questionam o status moral e a consciência de Claude, enfatizando que não estão sozinhos nessas reflexões e que concorrentes e colegas também ponderam questões semelhantes.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A Sony apresentou seus mais recentes televisores de fabricação própria, e a TCL assumirá o posto em seguida.

Esta semana, o Grupo Sony apresentou duas televisões premium, que parecem ser os últimos modelos…

1 hora atrás

A IA tornou-se menos propensa a alucinações, mas ainda apresenta mentiras como verdades com muita convicção.

O problema das alucinações, ou respostas deliberadamente incorretas, fornecidas por modelos de IA continua sendo…

3 horas atrás

O tráfego de buscas do DuckDuckGo triplicou após a última atualização de busca com IA do Google.

Os desenvolvedores do DuckDuckGo, um mecanismo de busca focado em privacidade, anunciaram que a versão…

3 horas atrás

AMD lança os SoCs adaptáveis ​​Versal Prime de segunda geração.

A AMD anunciou novos SoCs adaptativos da família Versal Prime Gen 2: o 2VM3454, o…

4 horas atrás