Categorias: Programas

O Google apresentou o TranslateGemma, uma família de modelos de IA de código aberto para tradução local em 55 idiomas.

O Google lançou três versões do seu modelo de IA TranslateGemma para oferecer suporte à tradução em dezenas de idiomas em dispositivos portáteis e móveis. A versão com 4 bilhões de parâmetros é otimizada para dispositivos móveis, a versão com 12 bilhões de parâmetros foi projetada para laptops de consumo e a versão com 27 bilhões de parâmetros foi projetada para servidores em nuvem equipados com uma única GPU H100 ou Unidade de Processamento Tensor.

Fonte da imagem: Google

O Google testou seus novos algoritmos na plataforma MetricX, que rastreia erros de tradução (pontuações mais baixas indicam melhores resultados de tradução). O modelo TranslateGemma, com 12 bilhões de parâmetros, obteve 3,6 pontos, superando a versão básica Gemma 3, com 27 bilhões de parâmetros, que obteve 4,04 pontos neste teste. Comparado à versão Gemma 3 de 12 bilhões de parâmetros, que obteve 4,86 ​​pontos no MetricX, a taxa de erros diminuiu em aproximadamente 26%. Melhorias significativas na qualidade da tradução foram observadas para todos os 55 pares de idiomas testados, incluindo idiomas menos populares. Por exemplo, o número de erros de tradução do inglês para o islandês diminuiu 30% e do suaíli, 25%.

O treinamento de algoritmos em dois estágios permite que o conhecimento do Gemini seja transferido para modelos mais compactos. No primeiro estágio, os algoritmos são treinados com dados paralelos — tanto traduções humanas quanto aquelas geradas por outras redes neurais. No segundo estágio, a qualidade da tradução é otimizada por meio de aprendizado por reforço, onde diversas redes de avaliação automática avaliam os dados sem a necessidade de traduções humanas de referência. Um modelo separado avalia o quão natural soa a tradução resultante.

Para manter a versatilidade dos modelos apesar de sua especialização, 30% do conjunto de treinamento consistiu em dados compartilhados. Isso significa que os modelos do TranslateGemma podem funcionar como chatbots tradicionais. A avaliação por tradutores profissionais geralmente confirmou as melhorias, com uma exceção: uma queda na qualidade foi observada nas traduções de japonês para inglês, que o Google atribui a erros no processamento de nomes próprios.

Todos os três modelos de IA mantêm as capacidades multimodais do Gemma 3. Eles podem traduzir texto a partir de imagens, mesmo sem treinamento adicional. Testes no benchmark Vistra mostraram que as melhorias na tradução de texto também se estendem à tradução de imagens. Para obter resultados ótimos, o Google recomenda o uso de instruções que orientem o modelo a agir como um “tradutor profissional”, levando em consideração as diversas nuances culturais. Os três novos modelos do TranslateGemma estão disponíveis nas plataformas Kaggle e Hugging Face.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Não há mal que não traga algum bem: o roubo de dados do GTA Online por hackers resultou em uma forte alta no preço das ações da Take-Two.

Os dados roubados do estúdio britânico Rockstar Games, divulgados por hackers do grupo ShinyHunters, não…

20 minutos atrás

Analistas: Após dois anos e meio, Starfield no PS5 está praticamente inútil.

Apesar de mais de dois anos e meio de espera, os proprietários do PS5 não…

1 hora atrás

A funcionalidade de recuperação do Windows, redesenhada, ainda não atende aos requisitos de segurança.

Quando a Microsoft anunciou pela primeira vez o recurso Recall, que usa algoritmos de IA…

2 horas atrás

Um aplicativo europeu de verificação de idade está pronto para ser lançado.

Um aplicativo de verificação de idade para plataformas online destinado a usuários europeus está pronto…

2 horas atrás

Lexar: Jogadores estão dispostos a sacrificar RAM, mas não SSD.

O crescimento exponencial da inteligência artificial criou uma escassez global de chips de memória DRAM…

2 horas atrás