O chatbot Claude AI interromperá “conversas prejudiciais ou ofensivas com usuários”

A Anthropic treinou seu chatbot de IA Claude para encerrar conversas que considere “prejudiciais ou ofensivas”. O recurso já está disponível no Opus 4 e 4.1. Ele permitirá que o chatbot encerre conversas como último recurso após um usuário tentar repetidamente gerar conteúdo prejudicial ou ofensivo. A Anthropic quer atingir o “bem-estar potencial” de seus modelos de IA encerrando conversas nas quais Claude sente “desconforto evidente”.

Fonte da imagem: Anthropic See More

Após Claude encerrar a conversa, o usuário não poderá enviar novas mensagens naquele chat, mas novas conversas ainda serão possíveis. A Anthropic observou que conversas que desencadeiam tal reação são “casos extremos”, acrescentando que a maioria dos usuários não encontrará esse obstáculo, mesmo ao discutir tópicos controversos.

Durante os testes do Claude Opus 4, observou-se que o chatbot tinha uma “forte e consistente aversão a causar danos”, incluindo a criação de conteúdo sexual envolvendo menores, atos violentos e terrorismo. Nesses casos, a Anthropic constatou que Claude demonstrava “ansiedade acentuada” e uma “tendência a encerrar conversas prejudiciais quando tinha oportunidade”.

Claude recebeu instruções explícitas para não encerrar conversas caso o usuário demonstre sinais de querer causar “dano iminente” a si mesmo ou a outras pessoas. Nesses casos, a Anthropic utiliza o serviço de apoio online para crises Throughline para ajudar a desenvolver respostas a perguntas sobre automutilação e saúde mental.

Na semana passada, a Anthropic atualizou sua política de uso de chatbots, visto que a rápida evolução dos modelos de IA gera crescentes preocupações com a segurança. A empresa agora proíbe o uso do Claude para desenvolver armas biológicas, nucleares, químicas ou radiológicas, ou para desenvolver códigos maliciosos ou explorar vulnerabilidades de rede.

admin

Postagens recentes

A Philips lançou o monitor Evnia 27M2G5800 com suporte para 5K a 165 Hz ou QHD a 330 Hz.

A Philips apresentou o Evnia 27M2G5800, um monitor gamer de 27 polegadas equipado com um…

29 minutos atrás

Escape from Tarkov no espaço: Fragmentary Order, o jogo de tiro de ficção científica hardcore da próxima geração, é anunciado.

O novo estúdio de jogos Rant, com o apoio da editora Cor3, revelou Fragmentary Order,…

1 hora atrás

A Red Hat demitiu centenas de programadores na China para transferir o desenvolvimento para a Índia.

A Red Hat parece ter eliminado completamente sua equipe de desenvolvimento na China, deixando de…

2 horas atrás

Informante: GTA VI pode impedir o lançamento de um novo Fable em 2026.

O ambicioso RPG de ação e fantasia Fable, do estúdio britânico Playground Games (série Forza…

2 horas atrás

A Toyota demonstrou em ação um robô de basquete sobre rodas de última geração.

A obsessão por usar robôs humanoides em esportes dinâmicos não se limita aos desenvolvedores chineses.…

2 horas atrás

A Coreia do Sul desenvolveu um módulo de câmera ultrafino com um campo de visão de 140 graus.

As dimensões das câmeras digitais modernas integradas em smartphones têm certas limitações, então a Apple,…

3 horas atrás