Grandes modelos de linguagem de inteligência artificial submetidos a um ataque massivo de conteúdo popular, mas de baixa qualidade, em mídias sociais apresentaram sinais de degradação — semelhantes aos observados em pessoas que passaram muito tempo nas mídias sociais ou no TikTok. Esta é a conclusão a que chegaram cientistas americanos após um estudo.
Fonte da imagem: Steve Johnson / unsplash.com
“Vivemos em uma era em que o volume de informações cresce mais rápido do que a capacidade de atenção, e muitas dessas informações se concentram em cliques, em vez de transmitir verdade ou profundidade. Pensamos: ‘E se treinássemos a IA para isso?'”, disse Junyuan Hong, um dos pesquisadores do estudo. Para descobrir, os cientistas pegaram dois modelos de código aberto, Meta✴Llama e Alibaba Qwen, e os treinaram do zero usando tipos específicos de conteúdo: conteúdo “engajador”, que inclui postagens comuns nas redes sociais, bem como postagens sensacionalistas ou promocionais com frases como “Uau!”, “Confira isso!” ou “Só hoje!”.
Após treinar os modelos com esses materiais, os pesquisadores os testaram para avaliar o impacto dessa dieta “lixo” das redes sociais na IA. Os modelos expostos a essa influência mostraram sinais de degradação: diminuição da capacidade mental, das habilidades de raciocínio e comprometimento da memória. Eles também demonstraram um senso de ética diminuído e desenvolveram sinais de psicopatia. Estudos semelhantes conduzidos com humanos produziram resultados semelhantes.
O projeto, apontam os cientistas, é importante para o campo da IA: os desenvolvedores de modelos podem presumir que postagens em mídias sociais são uma fonte adequada para o treinamento de modelos. Incluir tais materiais em conjuntos de treinamento pode ser apresentado como escalonamento de dados, mas, na realidade, prejudica invisivelmente as habilidades de raciocínio, a qualidade dos julgamentos éticos e a capacidade de manter a atenção em um contexto de longo prazo. Além disso, modelos inicialmente enfraquecidos por materiais de baixa qualidadeconsequentemente, difícil de retreinar. Ironicamente, uma parcela significativa do conteúdo de engajamento do usuário nas mídias sociais já é gerada por IA.
Há cerca de cinco anos, os primeiros robôs de entrega da Yandex apareceram nas ruas…
A OpenAI anunciou a aquisição da Software Applications, uma empresa que desenvolve um sistema para…
O tema da computação quântica tem sido manchete de publicações populares e se tornou relativamente…
Moscou está trabalhando na criação de um novo mapa de alta precisão para a implantação…
A Comissão Europeia anunciou acusações contra o TikTok e o Meta por violarem os requisitos…
A Nexperia, fabricante de propriedade chinesa, ganhou reconhecimento global graças à aquisição da empresa pelo…