O principal especialista em segurança de IA da OpenAI se juntou a um concorrente.

Andrea Vallone, pesquisadora líder em segurança de IA, deixou a OpenAI e se juntou à sua concorrente, a Anthropic. Na OpenAI, Vallone passou três anos liderando pesquisas sobre a questão crítica e atualmente pouco regulamentada de como os modelos de IA devem responder quando os usuários demonstram sinais de dependência emocional excessiva ou indícios precoces de doenças mentais em suas interações.

Fonte da imagem: Anthropic

Segundo o The Verge, Vallone se juntará à equipe de Alinhamento da Anthropic. Sua mudança ocorre em um momento de crescente atenção aos riscos éticos e sociais associados à IA generativa. No último ano, diversas startups líderes enfrentaram críticas significativas e processos judiciais após incidentes trágicos em que usuários com problemas de saúde mental agravaram seu sofrimento durante conversas com chatbots. Por exemplo, houve casos amplamente divulgados de adolescentes que cometeram suicídio e adultos que cometeram assassinato após interagirem com IA. Essa questão já foi discutida em uma audiência de subcomissão do Senado dos EUA, e as famílias das vítimas entraram com ações judiciais.

Durante seus três anos em seu cargo anterior, ela formou uma equipe para estudar políticas de comportamento de IA e participou da implementação do GPT-4, modelos de raciocínio e GPT-5, além de desenvolver processos de treinamento para métodos de segurança técnica essenciais. Na Anthropic, Vallone trabalhará sob a supervisão de Jan Leike, que deixou a OpenAI em maio de 2024, afirmando que os “processos de segurança da empresa deram lugar a produtos chamativos”.

Em sua publicação no LinkedIn, Vallone escreveu que está “ansiosa para continuar minha pesquisa na Anthropic, focando no aprimoramento do comportamento de Claude em novos contextos”. Enquanto isso, Sam Bowman, um dos líderes da equipe de Alinhamento da Anthropic, escreveu em uma publicação no LinkedIn que está “orgulhoso da seriedade com que a Anthropic está encarando o problema de definir como um sistema de IA deve se comportar”.

admin

Postagens recentes

A Microsoft ensinará o Xbox a converter discos de jogos em licenças digitais.

A Microsoft começou a testar o recurso Disc2Digital para converter jogos físicos licenciados para formato…

41 minutos atrás

Mass Effect fica a desejar: ao contrário das expectativas dos jogadores, Exodus não terá um editor de personagens completo.

A Archetype Entertainment, veterana da BioWare, esclareceu um dos elementos mais obscuros de seu RPG…

1 hora atrás

A GeForce RTX 5090D tornou-se a primeira placa gráfica Blackwell cuja GPU atingiu 4 GHz.

A equipe de overclocking da OGS publicou um resultado de overclock de GPU para uma…

3 horas atrás

O Chrome 150 foi lançado, corrigindo quase 400 vulnerabilidades, incluindo 15 críticas.

Há um mês, o Google anunciou a correção de 429 vulnerabilidades no navegador Chrome, 22…

3 horas atrás

“Parece mais uma piada”: Sony decepcionou assinantes com o anúncio da seleção de jogos da PS Plus para julho.

Hoje, 1º de julho, a PlayStation já "alegrou" os usuários com notícias sobre o iminente…

3 horas atrás

Os desenvolvedores de Subnautica 2 finalmente receberão os bônus em dinheiro que merecem da Krafton, e o antigo novo CEO está deixando o estúdio novamente.

O sucesso do simulador de sobrevivência Subnautica 2, da Unknown Worlds Entertainment (UW), empresa americana…

4 horas atrás