Categorias: Programas

O Google apresentou o TranslateGemma, uma família de modelos de IA de código aberto para tradução local em 55 idiomas.

O Google lançou três versões do seu modelo de IA TranslateGemma para oferecer suporte à tradução em dezenas de idiomas em dispositivos portáteis e móveis. A versão com 4 bilhões de parâmetros é otimizada para dispositivos móveis, a versão com 12 bilhões de parâmetros foi projetada para laptops de consumo e a versão com 27 bilhões de parâmetros foi projetada para servidores em nuvem equipados com uma única GPU H100 ou Unidade de Processamento Tensor.

Fonte da imagem: Google

O Google testou seus novos algoritmos na plataforma MetricX, que rastreia erros de tradução (pontuações mais baixas indicam melhores resultados de tradução). O modelo TranslateGemma, com 12 bilhões de parâmetros, obteve 3,6 pontos, superando a versão básica Gemma 3, com 27 bilhões de parâmetros, que obteve 4,04 pontos neste teste. Comparado à versão Gemma 3 de 12 bilhões de parâmetros, que obteve 4,86 pontos no MetricX, a taxa de erros diminuiu em aproximadamente 26%. Melhorias significativas na qualidade da tradução foram observadas para todos os 55 pares de idiomas testados, incluindo idiomas menos populares. Por exemplo, o número de erros de tradução do inglês para o islandês diminuiu 30% e do suaíli, 25%.

O treinamento de algoritmos em dois estágios permite que o conhecimento do Gemini seja transferido para modelos mais compactos. No primeiro estágio, os algoritmos são treinados com dados paralelos — tanto traduções humanas quanto aquelas geradas por outras redes neurais. No segundo estágio, a qualidade da tradução é otimizada por meio de aprendizado por reforço, onde diversas redes de avaliação automática avaliam os dados sem a necessidade de traduções humanas de referência. Um modelo separado avalia o quão natural soa a tradução resultante.

Para manter a versatilidade dos modelos apesar de sua especialização, 30% do conjunto de treinamento consistiu em dados compartilhados. Isso significa que os modelos do TranslateGemma podem funcionar como chatbots tradicionais. A avaliação por tradutores profissionais geralmente confirmou as melhorias, com uma exceção: uma queda na qualidade foi observada nas traduções de japonês para inglês, que o Google atribui a erros no processamento de nomes próprios.

Todos os três modelos de IA mantêm as capacidades multimodais do Gemma 3. Eles podem traduzir texto a partir de imagens, mesmo sem treinamento adicional. Testes no benchmark Vistra mostraram que as melhorias na tradução de texto também se estendem à tradução de imagens. Para obter resultados ótimos, o Google recomenda o uso de instruções que orientem o modelo a agir como um “tradutor profissional”, levando em consideração as diversas nuances culturais. Os três novos modelos do TranslateGemma estão disponíveis nas plataformas Kaggle e Hugging Face.

admin

Próximo A Amazon confirmou a data de encerramento de New World: Aeternum, e os desenvolvedores de Rust se ofereceram para salvar o jogo e dar-lhe vida eterna. »

Anterior « Os 25 artigos mais populares da Wikipédia de todos os tempos foram revelados.

Deixar comentário

Publicado por

admin

1 mês atrás

Microsoft oficialmente enterrou Windows 10x. As melhores ideias aparecerão no Windows 10 habitual

Postagens recentes

Monitores, projetores, sintonizadores de TV, televisões

A Japannext lançou o monitor 6K mais acessível do mercado – um monitor IPS de 31,5 polegadas por €899.

Até recentemente, o Asus ProArt PA32QCV era o monitor 6K mais barato do mercado. Atualmente,…

40 minutos atrás

Módulos de RAM, cartões de memória, pen drives, leitores de cartões

A Kioxia começou a enviar chips de teste de memória flash UFS 5.0 para futuros smartphones topo de linha.

A Kioxia anunciou o início do envio de amostras de avaliação de sua memória flash…

40 minutos atrás

Notícias e análises financeiras

A empresa proprietária do TikTok se tornou uma das empresas privadas mais valiosas do mundo, com a ByteDance avaliada em US$ 550 bilhões.

Aproveitando o boom da IA, até mesmo startups privadas estão atingindo centenas de bilhões de…

41 minutos atrás

O mundo da robótica

A Amazon quer construir um grande centro de dados perto da usina nuclear de Comanche Peak, no Texas.

A Amazon planeja construir mais um data center no Texas. Desta vez, trata-se de uma…

57 minutos atrás

Jogos

Jornalistas revelaram os primeiros detalhes do enredo e do desenvolvimento de Wolfenstein 3.

O aguardado jogo de tiro antifascista Wolfenstein 3, da empresa sueca MachineGames (Indiana Jones and…

2 horas atrás

O mundo da robótica

A Xiaomi dobrará seus investimentos em pesquisa para US$ 29 bilhões e incentivará seus concorrentes a fazerem o mesmo.

A Xiaomi é uma montadora jovem para os padrões da indústria automotiva global, mas já…