O escritório de advocacia Clarkson entrou com uma ação coletiva no tribunal federal do Distrito Norte da Califórnia contra a OpenAI, desenvolvedora do popular bot ChatGPT AI. O reclamante acredita que o desenvolvedor violou os direitos de milhões de usuários da Internet usando seus dados disponíveis publicamente para treinar grandes modelos de linguagem que são a base dos algoritmos de IA.
De acordo com o sócio-gerente da Clarkson, Ryan Clarkson, a empresa quer representar no tribunal os interesses de “pessoas reais cujos dados foram roubados e desviados para criar essa tecnologia muito poderosa”. De acordo com as informações disponíveis, estamos falando de dados públicos de usuários, como comentários em redes sociais, postagens em blogs, artigos da Wikipédia, etc. Até o momento, os funcionários da OpenAI se abstiveram de comentar sobre o assunto.
O processo de Clarkson aborda um grande problema não resolvido no campo de redes neurais generativas, como bots de IA e geradores de imagens. Essas ferramentas são treinadas em uma enorme quantidade de dados disponíveis na Internet. Após a conclusão do treinamento, grandes modelos de linguagem podem formar respostas ao se comunicar com uma pessoa, compor poemas ou histórias, ter conversas complexas etc. No entanto, as pessoas cujos dados são usados para treinar redes neurais não consentiram no uso dessas informações por alguém como OpenAI.
«Toda essa informação é usada em escala, embora nunca tenha sido pensado para treinar grandes modelos de linguagem”, disse Clarkson. Ele também espera que o tribunal estabeleça certos limites sobre como os algoritmos de IA podem ser treinados e como as pessoas podem ser compensadas pelo uso de seus dados. A empresa já tem um grupo de demandantes e está procurando ativamente por novos clientes, disse a fonte.
O processo de Clarkson contra a OpenAI não é a primeira vez que desenvolvedores de IA são acusados de uso indevido de dados. Em novembro do ano passado, foi aberto um processo contra a OpenAI e a Microsoft em conexão com o fato de as empresas usarem o código do programa na plataforma GitHub para treinar ferramentas de IA. Em fevereiro, a plataforma Getty Images processou a Stability AI, acusando a empresa de usar ilegalmente as imagens do serviço para treinar sua rede neural generativa.
A NVIDIA anunciou o início das vendas globais da placa de vídeo intermediária GeForce RTX…
O Google, que decidiu se livrar dos cookies para a operação de mecanismos de publicidade…
O primeiro protótipo de produção de uma aeronave elétrica de decolagem e pouso vertical (eVTOL)…
Esta semana, um smartphone com tela flexível Google Pixel Fold foi colocado à venda. Logo…
A Micron apresentará os primeiros chips de memória GDDR7 no primeiro semestre de 2024. O…
A rede neural YandexGPT foi treinada em formatação de texto e acelerou seu trabalho -…