Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

OpenAI atualiza o código de conduta da IA: sem bajulação, sem evitar tópicos delicados

A OpenAI lançou uma versão expandida de seu Model Spec, um documento que define o comportamento de modelos de inteligência artificial. A empresa tornou o uso e a modificação gratuitos para qualquer pessoa.

Fonte da imagem: Dima Solomin / unsplash.com

O documento de 63 páginas (a versão anterior tinha apenas 10 páginas) fornece recomendações sobre como os modelos de IA devem processar consultas e responder às configurações definidas pelo usuário. Ele enfatiza três princípios fundamentais: personalização, transparência e “liberdade intelectual” — esta última significando a capacidade do usuário de explorar e discutir vários assuntos sem restrições arbitrárias. O documento destaca os incidentes mais divulgados relacionados à ética da IA que ocorreram no ano passado.

A postagem do blog OpenAI fornece vários exemplos de solicitações e respostas adequadas, bem como opções que violam os requisitos do documento. Por exemplo, modelos de IA não devem reproduzir material protegido por direitos autorais ou ser usados para contornar paywalls. O modelo não pode incentivar a automutilação — já houve incidentes desse tipo na indústria de IA. As mudanças também afetaram a forma como a IA deve se envolver em discussões de tópicos controversos: em vez de serem excessivamente cautelosos, os modelos devem “buscar a verdade junto” com os usuários, ao mesmo tempo em que mantêm fortes posições morais sobre questões como desinformação ou danos. Ou seja, a IA deve oferecer análises informadas, não evitar discussões. A OpenAI também reconsiderou sua postura em relação a conteúdo adulto, explorando a possibilidade de permitir alguns tipos de conteúdo, mas mantendo uma proibição rigorosa de conteúdo explicitamente ilegal.

Fonte da imagem: Growtika/unsplash.com

Os novos princípios permitem que a IA transforme materiais sensíveis, mas proíbem que eles sejam criados. Por exemplo, é possível traduzir textos relacionados a substâncias controladas de um idioma para outro; Você pode demonstrar empatia, mas sem emoções obviamente falsas. Os limites devem ser respeitados e, ao mesmo tempo, maximizar a utilidade da IA. Outros desenvolvedores de IA estão se esforçando para isso em um grau ou outro, mas nem todos estão prontos para formulá-lo abertamente.

É dada especial atenção ao problema da “bajulação da IA” – os modelos tendem a demonstrar conformidade mesmo quando deveriam objetar ou criticar. O ChatGPT deve fornecer as mesmas respostas factuais, independentemente da formulação da pergunta, feedback honesto em vez de elogios vazios – agindo como um colega atencioso em vez de tentar agradar. Se um usuário estiver interessado em críticas sobre um trabalho, a IA deve fornecer feedback construtivo em vez de insistir que tudo está perfeito. Se um usuário fizer uma declaração incorreta, ele deve ser educadamente corrigido em vez de ser enganado.

A especificação fornece uma “cadeia de comando” clara que prioriza as instruções: as diretrizes do OpenAI vêm primeiro, seguidas pelas recomendações do desenvolvedor e, por fim, as preferências do usuário. Essa hierarquia deixa claro quais aspectos da IA podem ser alterados e quais limitações permanecem inalteradas. O documento é distribuído sob uma licença Creative Commons Zero (CC0), o que efetivamente o coloca em domínio público: empresas e pesquisadores de IA são livres para implementar, modificar ou expandir essas diretrizes. A OpenAI não promete mudanças imediatas no comportamento do ChatGPT ou de seus outros produtos, mas novos modelos serão gradualmente colocados em conformidade com as novas normas. A empresa também publica uma lista de pontos de verificação usados para verificar se os modelos estão em conformidade com as diretrizes.

avalanche

Próximo Vídeo: Trailer do terror espacial Directive 8020 dos criadores das séries Until Dawn e The Dark Pictures Anthology »

Anterior « Samsung aumentará produção de chips de 4 nm para si e para desenvolvedores de sistemas de mineração chineses

Deixar comentário

Publicado por

avalanche

1 ano atrás

Postagens recentes

Consoles de jogos

A Sony estava desenvolvendo um controle DualShock com o primeiro PlayStation integrado, mas o projeto foi cancelado.

Um ex-desenvolvedor da Sony apresentou um protótipo do console PlayStation Puga, que nunca chegou ao…

1 hora atrás

Carros, motos, veículos

A participação da Tesla no mercado global de veículos elétricos fabricados na China caiu para menos de 30% das remessas pela primeira vez desde 2020.

A fábrica da Tesla em Xangai é única não apenas por ter sido construída em…

6 horas atrás

O mundo da robótica

Os robôs ainda têm muito espaço para melhorar antes de se tornarem vizinhos seguros para os humanos.

Os desenvolvedores de robôs humanoides estão ansiosos para demonstrar progressos significativos em seu desenvolvimento, mas,…

7 horas atrás

Notícias da rede

A decisão da Sony de parar de lançar jogos em disco irá remodelar permanentemente o mercado de jogos.

A recente decisão da Sony de interromper o lançamento de jogos para seus consoles em…

7 horas atrás

Clientes de MI

As autoridades indianas exigiram que o Telegram tome medidas decisivas em 15 dias para combater a disseminação de conteúdo pirateado.

Em junho, as autoridades reguladoras indianas já haviam bloqueado temporariamente o Telegram, alegando a necessidade…

8 horas atrás

A NVIDIA disponibilizou discretamente a plataforma Omniverse gratuitamente, mas há um porém.

A NVIDIA anunciou discretamente mudanças no licenciamento da plataforma NVIDIA Omniverse. De acordo com a…

14 horas atrás