O Google apresentou seu novo modelo Gemini 3.5 Live Translate, projetado para tradução de voz em tempo real. A rede neural reconhece automaticamente mais de 70 idiomas e gera traduções preservando a entonação, o ritmo e o tom originais do falante.
Fonte da imagem: Google
Ao contrário de sistemas que esperam o final de uma frase, o novo algoritmo processa o fluxo de áudio de forma síncrona. O atraso entre a fala original e a tradução é de apenas alguns segundos, eliminando pausas artificiais no diálogo. O modelo é adaptado para funcionar em ambientes ruidosos e não requer configuração manual de parâmetros adicionais. Para segurança e combate à desinformação, todas as gravações de áudio geradas são marcadas com uma marca d’água digital invisível, o SynthID.
A ferramenta já está disponível para desenvolvedores em versão prévia pública por meio da API Gemini Live e do Google AI Studio, e a integração com plataformas especializadas como Agora, LiveKit e Vision Agents permite que os desenvolvedores criem aplicativos sem a necessidade de construir sua própria infraestrutura complexa de streaming de mídia. A tecnologia também está sendo testada pelo serviço asiático de táxi e entrega Grab, que processa mais de 10 milhões de chamadas por mês, para facilitar a comunicação entre motoristas e clientes.
No segmento corporativo, a implementação do algoritmo começará este mês como parte de um teste fechado para assinantes do Google Workspace no serviço de videoconferência Google Meet. A atualização permitirá a tradução de conversas usando mais de 2.000 combinações de idiomas em uma única reunião, enquanto a versão anterior do sistema suportava apenas cinco idiomas e exigia inglês. O lançamento para empresas está previsto para o final do ano.
Usuários comuns terão acesso ao recurso por meio de uma atualização global do aplicativo Google Tradutor para iOS e Android. O sistema reproduzirá o texto traduzido quando fones de ouvido forem conectados.Fale diretamente com a outra pessoa. Os usuários de dispositivos Android também contam com um “modo de escuta” especial que permite ouvir a tradução diretamente pelo alto-falante do telefone. Como o Google explica em sua postagem no blog, esse recurso pode ser útil em situações em que “você precisa ouvir a tradução rapidamente sem alertar os outros e não tem fones de ouvido à mão”.
Um tribunal federal dos EUA negou o pedido da Meta para arquivar um processo movido…
O estúdio francês Quantic Dream (Heavy Rain, Beyond: Two Souls, Detroit: Become Human) respondeu às…
Pela primeira vez em mais de 15 anos, o comitê de Busca por Inteligência Extraterrestre…
Na Eurobike 2026 em Frankfurt, duas empresas chinesas apresentaram motores elétricos que mudam radicalmente a…
Os smartphones da próxima geração, independentemente do fabricante, poderão usar um único padrão de carregamento…
A Xiaomi lançou o smartphone Redmi K90 Ultra na China. O dispositivo possui um ventilador…