O Google lançou três versões do seu modelo de IA TranslateGemma para oferecer suporte à tradução em dezenas de idiomas em dispositivos portáteis e móveis. A versão com 4 bilhões de parâmetros é otimizada para dispositivos móveis, a versão com 12 bilhões de parâmetros foi projetada para laptops de consumo e a versão com 27 bilhões de parâmetros foi projetada para servidores em nuvem equipados com uma única GPU H100 ou Unidade de Processamento Tensor.
Fonte da imagem: Google
O Google testou seus novos algoritmos na plataforma MetricX, que rastreia erros de tradução (pontuações mais baixas indicam melhores resultados de tradução). O modelo TranslateGemma, com 12 bilhões de parâmetros, obteve 3,6 pontos, superando a versão básica Gemma 3, com 27 bilhões de parâmetros, que obteve 4,04 pontos neste teste. Comparado à versão Gemma 3 de 12 bilhões de parâmetros, que obteve 4,86 pontos no MetricX, a taxa de erros diminuiu em aproximadamente 26%. Melhorias significativas na qualidade da tradução foram observadas para todos os 55 pares de idiomas testados, incluindo idiomas menos populares. Por exemplo, o número de erros de tradução do inglês para o islandês diminuiu 30% e do suaíli, 25%.
O treinamento de algoritmos em dois estágios permite que o conhecimento do Gemini seja transferido para modelos mais compactos. No primeiro estágio, os algoritmos são treinados com dados paralelos — tanto traduções humanas quanto aquelas geradas por outras redes neurais. No segundo estágio, a qualidade da tradução é otimizada por meio de aprendizado por reforço, onde diversas redes de avaliação automática avaliam os dados sem a necessidade de traduções humanas de referência. Um modelo separado avalia o quão natural soa a tradução resultante.
Para manter a versatilidade dos modelos apesar de sua especialização, 30% do conjunto de treinamento consistiu em dados compartilhados. Isso significa que os modelos do TranslateGemma podem funcionar como chatbots tradicionais. A avaliação por tradutores profissionais geralmente confirmou as melhorias, com uma exceção: uma queda na qualidade foi observada nas traduções de japonês para inglês, que o Google atribui a erros no processamento de nomes próprios.
Todos os três modelos de IA mantêm as capacidades multimodais do Gemma 3. Eles podem traduzir texto a partir de imagens, mesmo sem treinamento adicional. Testes no benchmark Vistra mostraram que as melhorias na tradução de texto também se estendem à tradução de imagens. Para obter resultados ótimos, o Google recomenda o uso de instruções que orientem o modelo a agir como um “tradutor profissional”, levando em consideração as diversas nuances culturais. Os três novos modelos do TranslateGemma estão disponíveis nas plataformas Kaggle e Hugging Face.
O mercado de IA empresarial está se monetizando mais rapidamente, por isso a OpenAI direcionou…
A Nvidia está comemorando o sexto aniversário de sua plataforma de jogos em nuvem GeForce…
No final de 2025, o presidente dos EUA, Donald Trump, expressou sua intenção de fornecer…
O Google expandirá em breve significativamente o suporte ao compartilhamento de arquivos entre dispositivos Android…
A Anthropic apresentou uma nova versão de seu principal modelo de linguagem, o Claude Opus…
A Noctua é conhecida não apenas por seus coolers e ventoinhas marrom-bege, mas também por…