O chatbot Claude AI interromperá “conversas prejudiciais ou ofensivas com usuários”

A Anthropic treinou seu chatbot de IA Claude para encerrar conversas que considere “prejudiciais ou ofensivas”. O recurso já está disponível no Opus 4 e 4.1. Ele permitirá que o chatbot encerre conversas como último recurso após um usuário tentar repetidamente gerar conteúdo prejudicial ou ofensivo. A Anthropic quer atingir o “bem-estar potencial” de seus modelos de IA encerrando conversas nas quais Claude sente “desconforto evidente”.

Fonte da imagem: Anthropic See More

Após Claude encerrar a conversa, o usuário não poderá enviar novas mensagens naquele chat, mas novas conversas ainda serão possíveis. A Anthropic observou que conversas que desencadeiam tal reação são “casos extremos”, acrescentando que a maioria dos usuários não encontrará esse obstáculo, mesmo ao discutir tópicos controversos.

Durante os testes do Claude Opus 4, observou-se que o chatbot tinha uma “forte e consistente aversão a causar danos”, incluindo a criação de conteúdo sexual envolvendo menores, atos violentos e terrorismo. Nesses casos, a Anthropic constatou que Claude demonstrava “ansiedade acentuada” e uma “tendência a encerrar conversas prejudiciais quando tinha oportunidade”.

Claude recebeu instruções explícitas para não encerrar conversas caso o usuário demonstre sinais de querer causar “dano iminente” a si mesmo ou a outras pessoas. Nesses casos, a Anthropic utiliza o serviço de apoio online para crises Throughline para ajudar a desenvolver respostas a perguntas sobre automutilação e saúde mental.

Na semana passada, a Anthropic atualizou sua política de uso de chatbots, visto que a rápida evolução dos modelos de IA gera crescentes preocupações com a segurança. A empresa agora proíbe o uso do Claude para desenvolver armas biológicas, nucleares, químicas ou radiológicas, ou para desenvolver códigos maliciosos ou explorar vulnerabilidades de rede.

admin

Postagens recentes

Cientistas chineses descobriram algo em amostras do lado oculto da Lua que nunca havia sido visto antes na natureza.

As primeiras amostras de solo do lado oculto da Lua trazidas à Terra revelaram outra…

41 minutos atrás

A Apple voltou a ser a marca mais valiosa do mundo, enquanto a Nvidia subiu para o quinto lugar.

Embora a receita de diferentes empresas ainda seja uma métrica mais ou menos tangível para…

41 minutos atrás

A atualização mais recente do Windows 11 revelou novos bugs — ela afeta o modo de suspensão, o Citrix Director e muito mais.

A primeira atualização obrigatória do Windows 11 em 2026 causou diversos problemas em vários computadores.…

41 minutos atrás

Seguindo os passos da OpenAI: a Apple está preparando um dispositivo de IA em formato de disco – com duas câmeras, um botão e alto-falantes.

Jony Ive, ex-diretor de design da Apple e fundador da OpenAI, expressou seu interesse em…

53 minutos atrás

A Ubisoft já gastou mais de meio bilhão de dólares em Beyond Good and Evil 2, enquanto o projeto de longa data passa por uma nova reformulação.

Na véspera, a editora e desenvolvedora francesa Ubisoft realizou uma grande reformulação de seu catálogo,…

1 hora atrás