O Google apresentou o Gemini 3.5 Live Translate, um modelo de IA baseado em som para tradução simultânea com preservação da entonação.

O Google apresentou seu novo modelo Gemini 3.5 Live Translate, projetado para tradução de voz em tempo real. A rede neural reconhece automaticamente mais de 70 idiomas e gera traduções preservando a entonação, o ritmo e o tom originais do falante.

Fonte da imagem: Google

Ao contrário de sistemas que esperam o final de uma frase, o novo algoritmo processa o fluxo de áudio de forma síncrona. O atraso entre a fala original e a tradução é de apenas alguns segundos, eliminando pausas artificiais no diálogo. O modelo é adaptado para funcionar em ambientes ruidosos e não requer configuração manual de parâmetros adicionais. Para segurança e combate à desinformação, todas as gravações de áudio geradas são marcadas com uma marca d’água digital invisível, o SynthID.

A ferramenta já está disponível para desenvolvedores em versão prévia pública por meio da API Gemini Live e do Google AI Studio, e a integração com plataformas especializadas como Agora, LiveKit e Vision Agents permite que os desenvolvedores criem aplicativos sem a necessidade de construir sua própria infraestrutura complexa de streaming de mídia. A tecnologia também está sendo testada pelo serviço asiático de táxi e entrega Grab, que processa mais de 10 milhões de chamadas por mês, para facilitar a comunicação entre motoristas e clientes.

No segmento corporativo, a implementação do algoritmo começará este mês como parte de um teste fechado para assinantes do Google Workspace no serviço de videoconferência Google Meet. A atualização permitirá a tradução de conversas usando mais de 2.000 combinações de idiomas em uma única reunião, enquanto a versão anterior do sistema suportava apenas cinco idiomas e exigia inglês. O lançamento para empresas está previsto para o final do ano.

Usuários comuns terão acesso ao recurso por meio de uma atualização global do aplicativo Google Tradutor para iOS e Android. O sistema reproduzirá o texto traduzido quando fones de ouvido forem conectados.Fale diretamente com a outra pessoa. Os usuários de dispositivos Android também contam com um “modo de escuta” especial que permite ouvir a tradução diretamente pelo alto-falante do telefone. Como o Google explica em sua postagem no blog, esse recurso pode ser útil em situações em que “você precisa ouvir a tradução rapidamente sem alertar os outros e não tem fones de ouvido à mão”.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A Electronic Arts fez sua previsão sobre quem vencerá a Copa do Mundo da FIFA de 2026, repetindo o feito dos quatro vencedores anteriores.

Embora a Electronic Arts tenha perdido sua licença oficial para a Copa do Mundo da…

33 minutos atrás

Apresentado o Logitech Mobi Fold: Mouse dobrável com rolagem por toque e carregamento rápido.

A Logitech anunciou o Mobi Fold, um mouse dobrável projetado para uso em movimento. Ele…

1 hora atrás

A Índia questionou a segurança da Starlink e adiou seu lançamento no país.

A rede de comunicações via satélite Starlink possui tal cobertura e velocidades de transmissão de…

1 hora atrás

Monumento do Triunfo: Fãs derrubaram os servidores de Destiny 2 durante o lançamento da última atualização em protesto contra o fim do suporte.

Os fãs do jogo de tiro online gratuito Destiny 2, da Bungie, empresa pertencente à…

1 hora atrás

O chefe de IA da Microsoft criticou a Anthropic por tentar atribuir lampejos de consciência a Claude.

Mustafa Suleyman, chefe de IA da Microsoft, classificou as tentativas da Anthropic de sugerir que…

1 hora atrás

A SkyDrive planeja lançar táxis voadores nos céus do Japão em 2028.

O pequeno setor de aviação elétrica atraiu um número significativo de startups, e a japonesa…

2 horas atrás