O Google apresentou o Gemini 3.5 Live Translate, um modelo de IA baseado em som para tradução simultânea com preservação da entonação.

O Google apresentou seu novo modelo Gemini 3.5 Live Translate, projetado para tradução de voz em tempo real. A rede neural reconhece automaticamente mais de 70 idiomas e gera traduções preservando a entonação, o ritmo e o tom originais do falante.

Fonte da imagem: Google

Ao contrário de sistemas que esperam o final de uma frase, o novo algoritmo processa o fluxo de áudio de forma síncrona. O atraso entre a fala original e a tradução é de apenas alguns segundos, eliminando pausas artificiais no diálogo. O modelo é adaptado para funcionar em ambientes ruidosos e não requer configuração manual de parâmetros adicionais. Para segurança e combate à desinformação, todas as gravações de áudio geradas são marcadas com uma marca d’água digital invisível, o SynthID.

A ferramenta já está disponível para desenvolvedores em versão prévia pública por meio da API Gemini Live e do Google AI Studio, e a integração com plataformas especializadas como Agora, LiveKit e Vision Agents permite que os desenvolvedores criem aplicativos sem a necessidade de construir sua própria infraestrutura complexa de streaming de mídia. A tecnologia também está sendo testada pelo serviço asiático de táxi e entrega Grab, que processa mais de 10 milhões de chamadas por mês, para facilitar a comunicação entre motoristas e clientes.

No segmento corporativo, a implementação do algoritmo começará este mês como parte de um teste fechado para assinantes do Google Workspace no serviço de videoconferência Google Meet. A atualização permitirá a tradução de conversas usando mais de 2.000 combinações de idiomas em uma única reunião, enquanto a versão anterior do sistema suportava apenas cinco idiomas e exigia inglês. O lançamento para empresas está previsto para o final do ano.

Usuários comuns terão acesso ao recurso por meio de uma atualização global do aplicativo Google Tradutor para iOS e Android. O sistema reproduzirá o texto traduzido quando fones de ouvido forem conectados.Fale diretamente com a outra pessoa. Os usuários de dispositivos Android também contam com um “modo de escuta” especial que permite ouvir a tradução diretamente pelo alto-falante do telefone. Como o Google explica em sua postagem no blog, esse recurso pode ser útil em situações em que “você precisa ouvir a tradução rapidamente sem alertar os outros e não tem fones de ouvido à mão”.

admin

Compartilhar
Publicado por
admin

Postagens recentes

O WhatsApp agora oferece apelidos para ocultar números de telefone – as reservas já estão disponíveis.

O WhatsApp adicionou um recurso de nome de usuário para ocultar números de telefone. O…

5 horas atrás

Calendário de lançamentos: 29 de junho a 5 de julho: Undergrounded, Monopoly: Star Wars Heróis vs. Vilões

A virada de junho para julho trouxe poucos lançamentos importantes, mas muitas atualizações e relançamentos…

6 horas atrás

A GeForce RTX 3060 começou a retornar às lojas na Europa e nos EUA.

As placas de vídeo GeForce RTX 3060 começaram a retornar aos mercados ocidentais. Os modelos…

7 horas atrás