Categorias: Programas

O Google apresentou o TranslateGemma, uma família de modelos de IA de código aberto para tradução local em 55 idiomas.

O Google lançou três versões do seu modelo de IA TranslateGemma para oferecer suporte à tradução em dezenas de idiomas em dispositivos portáteis e móveis. A versão com 4 bilhões de parâmetros é otimizada para dispositivos móveis, a versão com 12 bilhões de parâmetros foi projetada para laptops de consumo e a versão com 27 bilhões de parâmetros foi projetada para servidores em nuvem equipados com uma única GPU H100 ou Unidade de Processamento Tensor.

Fonte da imagem: Google

O Google testou seus novos algoritmos na plataforma MetricX, que rastreia erros de tradução (pontuações mais baixas indicam melhores resultados de tradução). O modelo TranslateGemma, com 12 bilhões de parâmetros, obteve 3,6 pontos, superando a versão básica Gemma 3, com 27 bilhões de parâmetros, que obteve 4,04 pontos neste teste. Comparado à versão Gemma 3 de 12 bilhões de parâmetros, que obteve 4,86 ​​pontos no MetricX, a taxa de erros diminuiu em aproximadamente 26%. Melhorias significativas na qualidade da tradução foram observadas para todos os 55 pares de idiomas testados, incluindo idiomas menos populares. Por exemplo, o número de erros de tradução do inglês para o islandês diminuiu 30% e do suaíli, 25%.

O treinamento de algoritmos em dois estágios permite que o conhecimento do Gemini seja transferido para modelos mais compactos. No primeiro estágio, os algoritmos são treinados com dados paralelos — tanto traduções humanas quanto aquelas geradas por outras redes neurais. No segundo estágio, a qualidade da tradução é otimizada por meio de aprendizado por reforço, onde diversas redes de avaliação automática avaliam os dados sem a necessidade de traduções humanas de referência. Um modelo separado avalia o quão natural soa a tradução resultante.

Para manter a versatilidade dos modelos apesar de sua especialização, 30% do conjunto de treinamento consistiu em dados compartilhados. Isso significa que os modelos do TranslateGemma podem funcionar como chatbots tradicionais. A avaliação por tradutores profissionais geralmente confirmou as melhorias, com uma exceção: uma queda na qualidade foi observada nas traduções de japonês para inglês, que o Google atribui a erros no processamento de nomes próprios.

Todos os três modelos de IA mantêm as capacidades multimodais do Gemma 3. Eles podem traduzir texto a partir de imagens, mesmo sem treinamento adicional. Testes no benchmark Vistra mostraram que as melhorias na tradução de texto também se estendem à tradução de imagens. Para obter resultados ótimos, o Google recomenda o uso de instruções que orientem o modelo a agir como um “tradutor profissional”, levando em consideração as diversas nuances culturais. Os três novos modelos do TranslateGemma estão disponíveis nas plataformas Kaggle e Hugging Face.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Por enquanto, não haverá novas placas GeForce RTX, e a Nvidia também reduzirá a produção das placas gráficas existentes em 30 a 40%.

O boom da IA ​​causou não apenas escassez de memória, mas também alta demanda pelos…

23 minutos atrás

A Microsoft ocultou as configurações de armazenamento do Windows 11 dos usuários comuns.

A Microsoft atualizou as regras de segurança do Windows 11. Agora, são necessários privilégios de…

23 minutos atrás

Filmes para a Lua estão a caminho: a NASA permitiu que astronautas levassem smartphones para o espaço pela primeira vez.

A área aeroespacial é considerada tecnologicamente avançada, mas dispositivos comuns e banais como smartphones eram…

1 hora atrás

Em vez de Baldur’s Gate 4, da Larian, será lançada uma série baseada em Baldur’s Gate 3 pela HBO e pelo co-criador de The Last of Us.

O estúdio belga Larian Studios, liderado por Swen Vincke, cancelou Baldur's Gate 4, mas uma…

1 hora atrás

A iFixit desmontou o novo AirTag e descobriu um problema antigo.

A equipe da Fixit desmontou o rastreador AirTag 2, seguindo sua tradição de examinar todos…

2 horas atrás

A Intel está assumindo a tarefa de educar aqueles que desejam fazer overclock em seus processadores Arrow Lake.

O overclocking nunca foi considerado um problema coberto pela garantia pelos fabricantes de CPUs, mas…

2 horas atrás