OpenAI lançará um programa de parceria projetado para coletar dados exclusivos de terceiros para treinamento em IA

A OpenAI anunciou o lançamento de um novo programa de parceria, OpenAI Data Partnerships, que visa obter conjuntos de dados exclusivos de terceiros para treinar seus modelos de IA. Esta iniciativa visa atrair bases de dados extensas, incluindo aquelas que não estão disponíveis publicamente. O que diferencia o programa é a sua abrangência: os dados não precisam ser quantitativos ou em formato de texto – o programa também está aberto a imagens, áudio e vídeo.

Fonte da imagem: Franz26/Pixabay

Os dados coletados podem abranger qualquer tema e ser apresentados em qualquer idioma, o principal requisito é que reflitam a intenção humana, sejam como longos ensaios ou diálogos cuidadosamente transcritos. Isso permitirá que a OpenAI melhore significativamente ferramentas como tecnologias de reconhecimento automático de fala e expanda a funcionalidade do ChatGPT, incluindo suporte para consultas de voz, o que tornará a interação do usuário mais natural.

Os futuros testes de modelos por meio de parcerias de dados OpenAI expandirão os recursos da principal rede neural GPT-4 Turbo, que foi recentemente atualizada para fornecer respostas mais significativas aos usuários. A empresa afirma que já começou a trabalhar com organizações interessadas, incluindo o governo islandês. Usando conjuntos de dados especialmente selecionados, o OpenAI visa melhorar a capacidade do GPT-4 de entender as consultas dos usuários em islandês.

Organizações privadas ou públicas que desejam participar do programa de parceria OpenAI podem se inscrever no site da empresa, indicando o tipo e volume de dados fornecidos. São oferecidos dois caminhos de transferência de dados: o primeiro é um arquivo de código aberto, ideal para conjuntos de dados relevantes para o treinamento de modelos de linguagem. Porém, os dados apresentados desta forma estarão à disposição de todos.

Como alternativa, a OpenAI convida as organizações a fornecer informações na forma de dados privados que serão usados ​​para treinar seus próprios modelos de IA, incluindo modelos básicos, de precisão e personalizados. Esta opção é recomendada para empresas e instituições que desejam manter a privacidade de seus dados. A OpenAI enfatiza que não está interessada em dados que contenham informações pessoais ou sensíveis.

Este programa focará a atenção do público em questões de privacidade, dada a crescente audiência do ChatGPT de aproximadamente 100 milhões de usuários ativos semanais. Precedentes como a violação de dados de funcionários da Samsung demonstram a importância da segurança da informação.

A OpenAI garante que não utiliza os dados gerados através da sua API para treinar os seus próprios modelos de IA sem o consentimento explícito dos utilizadores. No entanto, a forma como tratamos e protegemos os dados sensíveis recolhidos através das Parcerias de Dados OpenAI estará sujeita ao escrutínio tanto da indústria como do público em geral.

avalanche

Postagens recentes

Os japoneses criaram uma memória magnética usando efeitos quânticos – ela é 25 vezes mais rápida que a DRAM, quase não esquenta e não se desgasta.

Cientistas da Universidade de Tóquio, em conjunto com colegas do Centro RIKEN CEMS, apresentaram um…

40 minutos atrás

A Thermal Grizzly está vendendo placas Core Ultra 7 270K Plus revendidas por US$ 525.

A Thermal Grizzly começou a vender processadores Intel Core Ultra 7 270K Plus revendidos. Esses…

40 minutos atrás

Asus e T1 lançam placas GeForce RTX de edição limitada para fãs de League of Legends.

A Asus, em colaboração com a equipe sul-coreana de esports de League of Legends, T1…

40 minutos atrás

Estudo: 9 em cada 10 dicas financeiras de blogueiros foram consideradas ruins – mas as pessoas ainda ficaram satisfeitas.

Segundo um estudo realizado no Reino Unido, os conselhos de influenciadores financeiros nas redes sociais…

7 horas atrás

Agora você pode programar em qualquer lugar: o ChatGPT para smartphones agora tem o Codex.

A OpenAI aprimorou o aplicativo móvel ChatGPT para desenvolvedores que trabalham em qualquer lugar, adicionando…

7 horas atrás

A Samsung iniciou cortes emergenciais na produção em antecipação a uma greve em massa.

A Samsung Electronics está se preparando para uma greve geral de 18 dias, planejada pelos…

7 horas atrás