NVIDIA compartilha como ajudou a tornar o Microsoft Cloud AI Translator mais eficiente

O Microsoft Translator, um serviço de tradução automática multilíngue baseado em nuvem, usa um dos maiores modelos de inteligência artificial do mundo para ajudar um grande número de pessoas a se comunicarem em vários idiomas. Os desenvolvedores continuam desenvolvendo o serviço e os servidores de inferência NVIDIA Triton (saída de dados do modelo), que fazem parte da plataforma NVIDIA AI Enterprise 2.0, os ajudam nisso.

Fonte da imagem: NVIDIA

O objetivo final dos desenvolvedores do Microsoft Cloud Translator é eliminar as barreiras de idioma usando a mesma API que já é usada ativamente para criar produtos diferentes. Considerando que cerca de 7 mil idiomas são usados ​​em todo o mundo, o objetivo dos desenvolvedores pode ser chamado de muito ambicioso.

Para resolver esse problema, os desenvolvedores usaram uma ferramenta poderosa e complexa – uma mistura de especialistas (MoE), que é um método de aprendizado de máquina em que várias redes de especialistas são usadas para dividir uma área problemática em áreas homogêneas. O modelo MoE fornece avanços significativos no processamento de linguagem natural, mas também é muito computacionalmente intensivo.

Os desenvolvedores usaram os sistemas NVIDIA Triton para construir um modelo único para várias tarefas de compreensão de texto, como resumo, geração de texto e tradução. Normalmente, diferentes modelos de IA são usados ​​para realizar tarefas individuais. O algoritmo da Microsoft divide grandes tarefas em muitas menores, e o recurso de lote dinâmico do Triton permite que essas várias solicitações sejam combinadas para obter o máximo da CPU.

Apesar da complexidade dos testes, desenvolvedores da NVIDIA e da Microsoft conseguiram obter um protótipo finalizado do modelo de IA em menos de um mês. Após a conclusão da fase de testes, o algoritmo será gradualmente integrado ao serviço de nuvem, onde na fase inicial está previsto ser usado para traduzir documentos para vários dos idiomas mais comuns.

avalanche

Postagens recentes

As autoridades indianas planejam exigir que os fabricantes de smartphones divulguem o código-fonte de seus produtos.

Uma nova iniciativa das autoridades indianas, citada pela Reuters, visa aumentar a transparência na área…

36 minutos atrás

Processador de PC 2025 Outlook / Analytics

É difícil considerar 2025 um ponto de virada no mercado de processadores. De certa forma,…

4 horas atrás

A MCST recebeu um lote de 10.000 processadores Elbrus-2S3.

Em 2025, a empresa privada russa MCST recebeu mais de 10.000 processadores Elbrus-2S3 de um…

7 horas atrás

A OpenAI investe US$ 500 milhões na unidade de energia da SoftBank, a SB Energy.

O OpenAI Group está investindo US$ 500 milhões na SB Energy, uma subsidiária do SoftBank…

15 horas atrás

A AMD superou a Nvidia por 210 a 120 em menções à IA na apresentação da CES 2026.

Na CES 2026, realizada esta semana em Las Vegas, EUA, as tecnologias de IA foram…

15 horas atrás

O Windows 11 contará com uma maneira oficial de desinstalar o Copilot.

Usuários com privilégios de administrador agora podem desinstalar o aplicativo Microsoft Copilot pré-instalado em dispositivos…

16 horas atrás