O chatbot Claude AI interromperá “conversas prejudiciais ou ofensivas com usuários”

A Anthropic treinou seu chatbot de IA Claude para encerrar conversas que considere “prejudiciais ou ofensivas”. O recurso já está disponível no Opus 4 e 4.1. Ele permitirá que o chatbot encerre conversas como último recurso após um usuário tentar repetidamente gerar conteúdo prejudicial ou ofensivo. A Anthropic quer atingir o “bem-estar potencial” de seus modelos de IA encerrando conversas nas quais Claude sente “desconforto evidente”.

Fonte da imagem: Anthropic See More

Após Claude encerrar a conversa, o usuário não poderá enviar novas mensagens naquele chat, mas novas conversas ainda serão possíveis. A Anthropic observou que conversas que desencadeiam tal reação são “casos extremos”, acrescentando que a maioria dos usuários não encontrará esse obstáculo, mesmo ao discutir tópicos controversos.

Durante os testes do Claude Opus 4, observou-se que o chatbot tinha uma “forte e consistente aversão a causar danos”, incluindo a criação de conteúdo sexual envolvendo menores, atos violentos e terrorismo. Nesses casos, a Anthropic constatou que Claude demonstrava “ansiedade acentuada” e uma “tendência a encerrar conversas prejudiciais quando tinha oportunidade”.

Claude recebeu instruções explícitas para não encerrar conversas caso o usuário demonstre sinais de querer causar “dano iminente” a si mesmo ou a outras pessoas. Nesses casos, a Anthropic utiliza o serviço de apoio online para crises Throughline para ajudar a desenvolver respostas a perguntas sobre automutilação e saúde mental.

Na semana passada, a Anthropic atualizou sua política de uso de chatbots, visto que a rápida evolução dos modelos de IA gera crescentes preocupações com a segurança. A empresa agora proíbe o uso do Claude para desenvolver armas biológicas, nucleares, químicas ou radiológicas, ou para desenvolver códigos maliciosos ou explorar vulnerabilidades de rede.

admin

Postagens recentes

11 TB de memória para IA: a Penguin Solutions apresenta o servidor de cache MemoryAI KV baseado em módulos CXL.

A Penguin Solutions anunciou o MemoryAI KV Cache Server, projetado para solucionar o problema de…

59 minutos atrás

A PlayStation vai receber um gerador de frames por IA semelhante ao da Radeon — mas não tão cedo.

O PlayStation da Sony começará a usar uma "biblioteca de geração de quadros equivalente" baseada…

59 minutos atrás

A Intel lançou inesperadamente o processador móvel Core i7-13645HX de 14 núcleos da geração Raptor Lake.

A Intel expandiu discretamente sua linha de processadores móveis Raptor Lake (Core de 13ª geração)…

59 minutos atrás

Crimson Desert foi lançado sem suporte para placas gráficas Intel Arc – e a Intel afirma que a culpa é dos desenvolvedores.

O novo jogo Crimson Desert, da desenvolvedora Pearl Abyss, foi lançado com uma ressalva surpreendente:…

1 hora atrás

Cientistas britânicos abandonaram o memristor convencional e fizeram uma descoberta inovadora na memória analógica.

Cientistas da Universidade de Cambridge desenvolveram um novo dispositivo nanoeletrônico que imita os princípios de…

1 hora atrás

Menos IA, mais confiabilidade: a Microsoft explica como irá restaurar a confiança perdida no Windows 11.

Nos últimos meses, a Microsoft parece ter feito esforços consideráveis ​​para provocar uma crise de…

2 horas atrás