Aproximadamente 2,8 mil línguas do mundo das sete mil conhecidas existem sem escrita. Esses idiomas não são adequados para sistemas de tradução modernos baseados em algoritmos de aprendizado de máquina, pois os computadores geralmente traduzem o idioma falado para o idioma escrito para posterior tradução para outro idioma. Meta* parece ter resolvido esse problema com uma nova ferramenta de IA.
Fonte da imagem: bruce mars/unsplash.com
Como parte do programa Universal Speech Translator (UST) da Meta*, o idioma falado em um idioma será traduzido para o idioma falado em outro, tornando muito mais fácil para os futuros habitantes do metaverso interagirem uns com os outros.
Como parte do projeto, os pesquisadores se voltaram para o dialeto Hokkien, uma das línguas oficiais de Taiwan e bastante difundida na Ásia, embora não tenha uma escrita própria.
Os sistemas de tradução automática geralmente exigem amostras de linguagem escrita e falada para treinar. Para contornar tais restrições, utiliza-se o chamado modelo. tradução de fala para unidade (S2UT), na qual a fala oral é convertida em “unidades acústicas” em tempo real.
A fala em um idioma não escrito é primeiro convertida em texto em um idioma intermediário escrito relacionado (neste caso, o mandarim), que já pode ser traduzido para o inglês e vice-versa, seguido pelo aprendizado de máquina do sistema. Até agora, o sistema fornece comunicação limitada entre falantes de Hokkien e falantes de inglês. Ele traduz uma frase por vez, mas o CEO da Meta*, Mark Zuckerberg, está confiante de que, com o tempo, o modelo será usado em vários idiomas e permitirá a comunicação em tempo real.
Além dos modelos e dados de treinamento já divulgados pela Meta*, a empresa publicou outras ferramentas que potencialmente permitem aos pesquisadores construir seus próprios sistemas S2ST.
* Ele está incluído na lista de associações públicas e organizações religiosas em relação às quais o tribunal tomou uma decisão final para liquidar ou proibir atividades com base na Lei Federal nº 114-FZ de 25 de julho de 2002 “Sobre o combate ao extremismo atividade”.
Fontes informadas relataram conversas entre a Anthropic, uma desenvolvedora americana de modelos de linguagem de…
A Tesla entregou mais de 480.000 veículos elétricos no segundo trimestre deste ano, um aumento…
Os desenvolvedores do navegador Opera anunciaram um novo recurso de segurança chamado Paste Protect, projetado…
As gigantes da tecnologia estão investindo tanto em inteligência artificial que continuam a alcançar seus…
O Departamento de Segurança Interna dos EUA está investigando uma violação da Rede de Informações…
A notícia da Game Business sobre o destino da Obsidian Entertainment alarmou os fãs do…