Mustafa Suleyman, chefe de IA da Microsoft, classificou as tentativas da Anthropic de sugerir que seus modelos de IA Claude estão mostrando sinais de consciência como “muito, muito perigosas”.

Fonte da imagem: Mustafa Suleyman
“Acho que alguns funcionários da Anthropic humanizaram tanto os algoritmos de Claude que, por sua vez, os enganaram, fazendo-os acreditar nos vislumbres de consciência que originalmente implantaram neles. Não queremos lidar com uma superinteligência que tenha qualquer noção de seus próprios sentimentos e sofrimento”, disse o especialista em entrevista ao podcast Decoder.
A “constituição”, ou fundamentos documentados do projeto de Claude, declara explicitamente a incerteza da Anthropic sobre se seu modelo de IA possui um senso de bem-estar e se experimenta sentimentos como “satisfação” e “desconforto”. A empresa declara sua intenção de “consultar” seus modelos de IA à medida que envelhecem e documentar suas “preferências” para versões futuras.
Suleyman chamou a abordagem da desenvolvedora ao produto de “erro filosófico”: a Anthropic transformou a constituição do modelo de IA em “um espaço para reflexão, como em um artigo científico, em vez de um mecanismo de aprendizado”. Como resultado, o modelo de IA Claude internalizou essas “teses sobre si mesmo e seu aprendizado”. O CEO da Anthropic, Dario Amodei, não descartou anteriormente a possibilidade de Claude ser consciente, afirmando que “não sabemos se os modelos são conscientes”, mas a empresa está “aberta” a ideias sobre o assunto.
“Não é isso que queremos da IA. Queremos que a IA seja uma ferramenta governável, responsável e coerente a serviço da humanidade”, enfatizou Mustafa Suleiman.