O Google apresentou o Gemini 3.5 Live Translate, um modelo de IA baseado em som para tradução simultânea com preservação da entonação.

O Google apresentou seu novo modelo Gemini 3.5 Live Translate, projetado para tradução de voz em tempo real. A rede neural reconhece automaticamente mais de 70 idiomas e gera traduções preservando a entonação, o ritmo e o tom originais do falante.

Fonte da imagem: Google

Ao contrário de sistemas que esperam o final de uma frase, o novo algoritmo processa o fluxo de áudio de forma síncrona. O atraso entre a fala original e a tradução é de apenas alguns segundos, eliminando pausas artificiais no diálogo. O modelo é adaptado para funcionar em ambientes ruidosos e não requer configuração manual de parâmetros adicionais. Para segurança e combate à desinformação, todas as gravações de áudio geradas são marcadas com uma marca d’água digital invisível, o SynthID.

A ferramenta já está disponível para desenvolvedores em versão prévia pública por meio da API Gemini Live e do Google AI Studio, e a integração com plataformas especializadas como Agora, LiveKit e Vision Agents permite que os desenvolvedores criem aplicativos sem a necessidade de construir sua própria infraestrutura complexa de streaming de mídia. A tecnologia também está sendo testada pelo serviço asiático de táxi e entrega Grab, que processa mais de 10 milhões de chamadas por mês, para facilitar a comunicação entre motoristas e clientes.

No segmento corporativo, a implementação do algoritmo começará este mês como parte de um teste fechado para assinantes do Google Workspace no serviço de videoconferência Google Meet. A atualização permitirá a tradução de conversas usando mais de 2.000 combinações de idiomas em uma única reunião, enquanto a versão anterior do sistema suportava apenas cinco idiomas e exigia inglês. O lançamento para empresas está previsto para o final do ano.

Usuários comuns terão acesso ao recurso por meio de uma atualização global do aplicativo Google Tradutor para iOS e Android. O sistema reproduzirá o texto traduzido quando fones de ouvido forem conectados.Fale diretamente com a outra pessoa. Os usuários de dispositivos Android também contam com um “modo de escuta” especial que permite ouvir a tradução diretamente pelo alto-falante do telefone. Como o Google explica em sua postagem no blog, esse recurso pode ser útil em situações em que “você precisa ouvir a tradução rapidamente sem alertar os outros e não tem fones de ouvido à mão”.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A Waymo criou um motorista virtual para testar a resposta do piloto automático a incidentes na estrada.

A Waymo criou um motorista virtual para estudar como os humanos reagem a incidentes inesperados…

44 minutos atrás

A Lenovo aumentará os preços dos PCs no próximo mês pela segunda vez este ano.

A dinâmica dos preços dos chips de memória deixa os fabricantes com poucas opções quando…

44 minutos atrás

A Commonwealth Fusion explica por que seu reator de fusão será o primeiro a entrar em operação.

Muitas incógnitas permanecem em relação ao lançamento do primeiro reator de fusão autossustentável do mundo.…

44 minutos atrás

O ChatGPT começou a recomendar lojas falsas e fraudulentas, e os usuários perderam dinheiro.

O ChatGPT começou a oferecer aos usuários links para lojas online falsas criadas por golpistas…

2 horas atrás

A receita da TSMC em maio aumentou 30%, impulsionada pelo boom da inteligência artificial.

Faltando duas semanas para o fim do segundo trimestre, a fabricante taiwanesa de chips TSMC…

2 horas atrás