Vários grandes representantes da mídia e plataformas de informação on-line estão em negociações com a OpenAI, a empresa por trás do popular chatbot de IA ChatGPT, sobre o acesso pago aos seus recursos. Esses recursos representam uma fonte crítica de informações sobre as quais grandes modelos de linguagem são treinados.

Fonte da imagem: Rolf van Root/unsplash.com

De acordo com o The Washington Post, empresas de tecnologia como a OpenAI têm usado recursos de notícias online gratuitamente há anos e usado seus materiais para treinar seus modelos de IA. O espaço generativo de IA teve um crescimento significativo de receitas recentemente. Alguns especialistas consultados pela Bloomberg estimam que as receitas neste segmento crescerão para 1,3 biliões de dólares até 2032. Os meios de comunicação e plataformas estão competindo por parte desse dinheiro.

Desde agosto deste ano, pelo menos 535 publicações importantes, incluindo o York Times, a Reuters e o The Washington Post, instalaram bloqueadores especiais nos seus recursos online que impedem a recolha de informações para formação no ChatGPT. Observa-se que os editores estão negociando com a OpenAI a questão de fornecer ao chatbot ChatGPT acesso pago a materiais publicados individuais específicos. Os editores acreditam que este esquema de interação tem duas vantagens inegáveis: as plataformas de informação receberão receitas adicionais por cada material publicado individualmente e também podem aumentar potencialmente o volume de tráfego para os seus sites.

Em julho, a OpenAI fechou um acordo com a agência de notícias Associated Press. Uma empresa de tecnologia pode utilizar as publicações do recurso sem restrições para treinar seus modelos de IA. Segundo fontes do The Washington Post, tal esquema de interação também está sendo considerado nas negociações entre a OpenAI e outras publicações. No entanto, estes últimos estão mais inclinados a fornecer acesso apenas a determinados materiais que poderiam ser exibidos em respostas a solicitações de usuários do mesmo ChatGPT.

Fontes do The Washington Post observam que outras plataformas online de interesse para treinamento de chatbot, como o Reddit, que cresceu de um pequeno e simples quadro de mensagens para uma enorme plataforma social, também estão procurando maneiras de monetizar ainda mais suas postagens. Fontes do Washington Post dizem que a plataforma está em negociações com empresas líderes de IA generativa para pagar por publicações que podem ser usadas para treinar modelos de IA. Se tal acordo não puder ser alcançado, o Reddit está pronto para considerar a possibilidade de introduzir uma página de autorização em sua plataforma, sem a qual o conteúdo não será exibido aos seus visitantes.

Tornar-se uma plataforma fechada poderia privar o Reddit dos resultados de pesquisa no Google, reduzindo o número de visitantes do site com base em referências de pesquisa. No entanto, de acordo com uma fonte anônima do The Washington Post, o Reddit acredita que vale a pena e que a plataforma “pode sobreviver sem pesquisa”. Publicamente, os representantes do Reddit negam tais declarações: “Nada muda”, disse a porta-voz da plataforma Courtney Geesey-Dorr em conversa com The Verge, que pediu comentários sobre a reportagem do The Washington Post.

Em abril, a rede social X (antigo Twitter) começou a cobrar US$ 42 mil dos pesquisadores para fornecer acesso a estatísticas detalhadas e postagens na plataforma. Anteriormente, esse acesso era fornecido gratuitamente, mas segundo o dono da rede social, Elon Musk, empresas envolvidas no desenvolvimento de inteligência artificial utilizavam ilegalmente essas plataformas para treinar seus modelos de IA.

D koi / unsplash.com

Com a IA generativa preparada para transformar a forma como os utilizadores interagem com a Internet, muitos editores e outras empresas consideram a cobrança pelas suas informações uma medida justa, encarando a questão como uma questão existencial. Por exemplo, um mês depois que a OpenAI lançou seu modelo avançado de IA GPT-4, o tráfego para a comunidade de programação Stack Overflow caiu 15% à medida que as pessoas recorriam à IA para questões relacionadas à codificação com mais frequência do que à popular plataforma web. O diretor executivo do Stack Overflow, Prashanth Chandrasekar, disse isso em uma conversa com o The Washington Post. Ele também acrescentou que o chatbot OpenAI também foi treinado com base em seus dados. Stack Overflow reduziu sua equipe em 28% esta semana.

Além das exigências de pagamento pelas informações usadas para treinar a IA, as principais empresas de inteligência artificial enfrentam vários processos judiciais de autores, artistas e programadores individuais exigindo danos por violação de direitos autorais, bem como para que essas empresas compartilhem uma participação com eles. Segundo a Reuters, uma ação coletiva foi movida esta semana contra Meta✴, Microsoft e Bloomberg. Os seus iniciadores afirmam que estas empresas usaram bibliotecas online piratas para treinar os seus sistemas de inteligência artificial.

De acordo com especialistas, a disposição da OpenAI de negociar com os editores pode indicar o desejo da empresa de fechar acordos para o uso legal de conteúdo e fortalecer sua estrutura legal antes que os tribunais intervenham para determinar se as empresas de tecnologia têm obrigações legais claras de licenciar conteúdo e pagar por isso … seu uso.

OpenAI confirmou que a empresa está em negociações com editoras. No entanto, o assunto não está relacionado ao conteúdo no qual seus modelos de IA já foram treinados. A empresa afirma ainda que obteve todas as informações para treinar legalmente seus modelos. “Nenhuma de nossas práticas viola a lei de direitos autorais”, disse um porta-voz da OpenAI. Segundo ele, no diálogo com as editoras, a empresa discute questões relacionadas a novos conteúdos, cujo acesso seria impossível sem acordos oficiais.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *