A Yandex melhorou a qualidade de seu serviço de tradução automática por meio do treinamento adicional de sua rede neural subjacente usando o grande modelo de linguagem YandexGPT. Como resultado, o Yandex Translator começou a navegar melhor no contexto, nas unidades fraseológicas e no vocabulário profissional.
O treinamento adicional ajudou o serviço a estabelecer melhor as conexões entre as frases e agora lida melhor com textos longos. Graças às habilidades de análise de contexto, o tradutor automático determina a orientação profissional do texto e deixa os termos necessários sem tradução.
«Yandex começou a usar IA no Tradutor em 2018, treinando-o em pares de textos – no original e traduzido para outro idioma. Esta é uma rede neural leve que pode processar um grande número de solicitações em tempo real. YandexGPT, ao contrário, gera textos complexos em diversidade lexical e estilística, incluindo terminologia específica. Portanto, eles decidiram envolver um grande modelo de linguagem para treinamento adicional da rede de tradutores neurais.
Os engenheiros do Yandex prepararam uma versão especial do YandexGPT otimizada para tradução de texto. Na fase de treinamento preliminar, processou um grande volume de textos em russo e inglês, estudou vocabulário, morfologia e sintaxe. Em seguida, o modelo de linguagem grande foi ajustado para tarefas de tradução; Na etapa de Aprendizado por Reforço (RL), a qualidade da tradução do YandexGPT foi avaliada e os resultados foram classificados do melhor ao pior.
Após a conclusão do treinamento adicional da rede neural Yandex Translator, seu trabalho foi submetido a uma avaliação comparativa. Especialistas que falam russo e inglês compararam pares de textos longos e complexos traduzidos por duas versões da rede neural – a nova lidou melhor com sua tarefa em 57% dos casos. A plataforma atualizada já está conectada ao Yandex Translator, um mecanismo de busca e serviço de tradução de vídeos no Yandex Browser.