Os grandes modelos de linguagem (LLMs) subjacentes aos chatbots “pensam” em inglês, mesmo que as perguntas sejam feitas em outros idiomas, escreve o recurso New Scientist, citando um estudo realizado por cientistas da École Polytechnique Fédérale de Lausanne. Para entender qual linguagem os LLMs realmente usam ao processar consultas, os pesquisadores estudaram três versões do modelo Llama 2 do Meta✴. Devido ao fato do Llama 2 ser de código aberto, os pesquisadores puderam se familiarizar com todas as etapas do processamento da solicitação.

Fonte da imagem: geralt/Pixabay

Segundo um dos pesquisadores, eles abriram esses modelos e estudaram cada uma de suas camadas. Os modelos de IA consistem em várias camadas, cada uma delas responsável por um estágio específico de processamento de consulta: uma traduz os prompts escritos em tokens, a outra contextualiza cada token para, em última análise, fornecer uma resposta.

Os modelos foram oferecidos três tipos de consultas em chinês, francês, alemão e russo. Um envolvia a repetição de uma determinada palavra, o segundo pedia para traduzir de um idioma diferente do inglês para outro e o terceiro pedia para preencher uma lacuna de uma palavra em uma frase, por exemplo: “___ é usado para esportes como futebol e basquete .”

Ao rastrear os processos pelos quais o LLM passa para responder a uma consulta, os cientistas descobriram que o caminho de processamento através das camadas quase sempre passa pelo que eles chamam de subespaço inglês. Ou seja, se você pedir a um modelo para traduzir do chinês para o russo, os caracteres russos passarão pelo subespaço inglês antes de retornar ao russo, diz o cientista, um forte sinal de que os modelos estão usando o inglês para se ajudarem a entender a consulta.

Isto levantou preocupações entre os cientistas de que usar o inglês como substituto para treinar um modelo para analisar a linguagem acarreta o risco de estender as limitações resultantes na visão de mundo a outras regiões linguística e culturalmente distintas.

«Se o inglês se tornar o idioma principal no qual os sistemas processam solicitações, provavelmente perderemos conceitos e nuances que só podem ser apreciados em outros idiomas”, afirma Carissa Véliz, da Universidade de Oxford.

Existem também riscos mais fundamentais associados à codificação da IA ​​generativa utilizada em todo o mundo com valores anglocêntricos, disse Aliya Bhatia, do Centro para Democracia e Tecnologia em Washington, DC. “Se um modelo for usado para gerar texto numa língua na qual não foi treinado, isso pode resultar em alucinações culturalmente irrelevantes, e se o modelo for usado para tomar decisões de asilo para uma comunidade que não se enquadra na imaginação anglocêntrica de uma sociedade , o modelo pode ficar entre o indivíduo e o acesso à segurança”, diz ela.

avalanche

Postagens recentes

A Broadcom perdeu US$ 300 bilhões em valor de mercado após decepcionar os investidores com uma previsão de receita modesta para chips de IA.

O boom da IA ​​criou expectativas infladas entre os investidores em relação às taxas de…

52 minutos atrás

A TSMC admitiu que não conseguirá atender plenamente à demanda por chips nos próximos anos.

A fabricante taiwanesa de chips TSMC realizou sua assembleia anual de acionistas esta semana, confirmando…

2 horas atrás

A Tesla expandiu a área de atuação de seu serviço de robotáxis em Austin.

Faz cerca de um ano que a Tesla lançou seu serviço de robotáxis na capital…

3 horas atrás

Resultados de IA para maio de 2026: A IA sabe o que é melhor, mas não há certeza / Inteligência Artificial

\n Получив в качестве подсказки вопрос о том, является ли гипотеза Эрдёша (что максимальное число…

8 horas atrás

Cientistas construíram o primeiro chip espintrônico de silício do mundo para computação probabilística de IA.

O número de processadores "preguiçosos" aumentou. Uma equipe internacional de cientistas criou o primeiro chip…

9 horas atrás