NVIDIA compartilha como ajudou a tornar o Microsoft Cloud AI Translator mais eficiente

O Microsoft Translator, um serviço de tradução automática multilíngue baseado em nuvem, usa um dos maiores modelos de inteligência artificial do mundo para ajudar um grande número de pessoas a se comunicarem em vários idiomas. Os desenvolvedores continuam desenvolvendo o serviço e os servidores de inferência NVIDIA Triton (saída de dados do modelo), que fazem parte da plataforma NVIDIA AI Enterprise 2.0, os ajudam nisso.

Fonte da imagem: NVIDIA

O objetivo final dos desenvolvedores do Microsoft Cloud Translator é eliminar as barreiras de idioma usando a mesma API que já é usada ativamente para criar produtos diferentes. Considerando que cerca de 7 mil idiomas são usados ​​em todo o mundo, o objetivo dos desenvolvedores pode ser chamado de muito ambicioso.

Para resolver esse problema, os desenvolvedores usaram uma ferramenta poderosa e complexa – uma mistura de especialistas (MoE), que é um método de aprendizado de máquina em que várias redes de especialistas são usadas para dividir uma área problemática em áreas homogêneas. O modelo MoE fornece avanços significativos no processamento de linguagem natural, mas também é muito computacionalmente intensivo.

Os desenvolvedores usaram os sistemas NVIDIA Triton para construir um modelo único para várias tarefas de compreensão de texto, como resumo, geração de texto e tradução. Normalmente, diferentes modelos de IA são usados ​​para realizar tarefas individuais. O algoritmo da Microsoft divide grandes tarefas em muitas menores, e o recurso de lote dinâmico do Triton permite que essas várias solicitações sejam combinadas para obter o máximo da CPU.

Apesar da complexidade dos testes, desenvolvedores da NVIDIA e da Microsoft conseguiram obter um protótipo finalizado do modelo de IA em menos de um mês. Após a conclusão da fase de testes, o algoritmo será gradualmente integrado ao serviço de nuvem, onde na fase inicial está previsto ser usado para traduzir documentos para vários dos idiomas mais comuns.

avalanche

Postagens recentes

Não há mal que não traga algum bem: o roubo de dados do GTA Online por hackers resultou em uma forte alta no preço das ações da Take-Two.

Os dados roubados do estúdio britânico Rockstar Games, divulgados por hackers do grupo ShinyHunters, não…

53 minutos atrás

A Microsoft receberá 30.000 aceleradores de IA NVIDIA Vera Rubin, que a OpenAI abandonou quando cancelou o projeto Stargate Norway.

A Microsoft e a Nscale expandiram sua parceria. A gigante da tecnologia está alugando 30.000…

1 hora atrás

Analistas: Após dois anos e meio, Starfield no PS5 está praticamente inútil.

Apesar de mais de dois anos e meio de espera, os proprietários do PS5 não…

2 horas atrás

A funcionalidade de recuperação do Windows, redesenhada, ainda não atende aos requisitos de segurança.

Quando a Microsoft anunciou pela primeira vez o recurso Recall, que usa algoritmos de IA…

2 horas atrás

Um aplicativo europeu de verificação de idade está pronto para ser lançado.

Um aplicativo de verificação de idade para plataformas online destinado a usuários europeus está pronto…

2 horas atrás