No final do ano passado, iniciou-se um processo no qual o The New York Times e outras grandes editoras acusaram a OpenAI de usar materiais que publicaram sem permissão para treinar suas redes neurais. Agora soube-se que os engenheiros da OpenAI excluíram acidentalmente dados que poderiam se tornar evidências de que o desenvolvedor de algoritmos de IA era culpado de violação de direitos autorais.
O relatório afirma que os advogados dos meios de comunicação passaram mais de 150 horas estudando os dados que a OpenAI usa para treinar suas redes neurais. O objetivo do seu trabalho era encontrar casos em que artigos de notícias de publicações protegidas pela lei de direitos autorais fossem usados para treinar algoritmos de IA. Não se sabe exatamente quais informações os engenheiros da OpenAI excluíram. A empresa admitiu o erro e tentou restaurar os dados, mas não foi possível fazê-lo por completo. Os mesmos dados recuperados não permitem determinar se as publicações das publicações estiveram envolvidas no treinamento das redes neurais. Os advogados da OpenAI descreveram a exclusão de dados como uma “falha”, e o The New York Times disse que “não havia razão para acreditar” que isso foi feito intencionalmente.
Em dezembro passado, o The New York Times acusou a OpenAI e sua maior parceira, a Microsoft, de criar seus algoritmos de IA “copiando e usando milhões de artigos” da publicação. A empresa exige que a OpenAI seja responsabilizada por “bilhões de dólares em danos estatutários e reais” por supostamente copiar os artigos da publicação. O New York Times já gastou mais de US$ 1 milhão lutando contra a OpenAI nos tribunais. Ao mesmo tempo, a OpenAI conseguiu negociar e fechar acordo com outras publicações, como Axel Springer, Conde Nast e Vox Media. Isto sugere que muitos editores preferem a colaboração em vez do litígio.