Não é nenhum segredo que grandes empresas de tecnologia usam conteúdo da Internet para treinar suas redes neurais. Neste contexto, o Google anunciou o lançamento de um novo controle chamado Google-Extended. Com sua ajuda, os administradores de sites podem proibir o gigante das buscas de usar conteúdo postado em recursos sob seu controle para treinar algoritmos Bard e Vertex.
«Hoje estamos anunciando o Google-Extended, um novo controle que os editores da Web podem usar para controlar se seus sites ajudam a melhorar o desempenho das APIs geradoras Bard e Vertex. Ao usar o Google-Extended para controlar o acesso ao conteúdo de um site, um administrador pode decidir se ajuda esses modelos de IA a se tornarem mais precisos e capazes ao longo do tempo”, afirmou o Google em comunicado.
O controle Google-Extended funciona como um token que pode ser adicionado ao arquivo robot.txt de um site. Este arquivo é usado para informar aos algoritmos de pesquisa qual conteúdo do site não deve ser indexado. Os proprietários de sites já podem adicionar o token apropriado para bloquear o scanner da OpenAI, que é o criador do popular bot de IA ChatGPT e outros algoritmos baseados em redes neurais.
Porém, no caso do Google a situação é diferente, já que a empresa possui o maior mecanismo de busca. A vantagem do novo token é que mesmo que o uso do conteúdo do site para treinamento de redes neurais seja limitado, a indexação não será interrompida, portanto a classificação do site no mecanismo de busca não diminuirá. Ao mesmo tempo, os proprietários de sites não terão que se preocupar com o fato de seu conteúdo ser usado para treinar algoritmos de IA.