O Google apresentou o Gemini 3.5 Live Translate, um modelo de IA baseado em som para tradução simultânea com preservação da entonação.

O Google apresentou seu novo modelo Gemini 3.5 Live Translate, projetado para tradução de voz em tempo real. A rede neural reconhece automaticamente mais de 70 idiomas e gera traduções preservando a entonação, o ritmo e o tom originais do falante.

Fonte da imagem: Google

Ao contrário de sistemas que esperam o final de uma frase, o novo algoritmo processa o fluxo de áudio de forma síncrona. O atraso entre a fala original e a tradução é de apenas alguns segundos, eliminando pausas artificiais no diálogo. O modelo é adaptado para funcionar em ambientes ruidosos e não requer configuração manual de parâmetros adicionais. Para segurança e combate à desinformação, todas as gravações de áudio geradas são marcadas com uma marca d’água digital invisível, o SynthID.

A ferramenta já está disponível para desenvolvedores em versão prévia pública por meio da API Gemini Live e do Google AI Studio, e a integração com plataformas especializadas como Agora, LiveKit e Vision Agents permite que os desenvolvedores criem aplicativos sem a necessidade de construir sua própria infraestrutura complexa de streaming de mídia. A tecnologia também está sendo testada pelo serviço asiático de táxi e entrega Grab, que processa mais de 10 milhões de chamadas por mês, para facilitar a comunicação entre motoristas e clientes.

No segmento corporativo, a implementação do algoritmo começará este mês como parte de um teste fechado para assinantes do Google Workspace no serviço de videoconferência Google Meet. A atualização permitirá a tradução de conversas usando mais de 2.000 combinações de idiomas em uma única reunião, enquanto a versão anterior do sistema suportava apenas cinco idiomas e exigia inglês. O lançamento para empresas está previsto para o final do ano.

Usuários comuns terão acesso ao recurso por meio de uma atualização global do aplicativo Google Tradutor para iOS e Android. O sistema reproduzirá o texto traduzido quando fones de ouvido forem conectados.Fale diretamente com a outra pessoa. Os usuários de dispositivos Android também contam com um “modo de escuta” especial que permite ouvir a tradução diretamente pelo alto-falante do telefone. Como o Google explica em sua postagem no blog, esse recurso pode ser útil em situações em que “você precisa ouvir a tradução rapidamente sem alertar os outros e não tem fones de ouvido à mão”.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A Microsoft corrigiu três vulnerabilidades zero-day perigosas e outras 200 falhas em seu software.

A Microsoft lançou sua atualização de junho na terça-feira de atualizações, corrigindo 200 vulnerabilidades, incluindo…

1 hora atrás

Inteligência artificial ajuda a atualizar drivers AMD Radeon que têm quase 20 anos.

Segundo o Phoronix, a versão mais recente do driver gráfico Gallium3D R600, incluída no Mesa…

3 horas atrás

A NASA apresentou a tripulação da missão lunar Artemis 3, mas ela não chegará à Lua.

A NASA anunciou os nomes dos astronautas que irão ao espaço na missão Artemis 3…

3 horas atrás

A Anthropic revelou Claude Fable 5, uma “versão segura” do tão comentado Mythos.

No início deste mês, a Anthropic expandiu a disponibilidade de seu modelo de IA mais…

4 horas atrás

A Meta utilizará a atividade do usuário em outros sites para personalizar seus feeds e respostas de IA.

A Meta✴ planeja usar dados de comportamento do usuário obtidos de outras empresas para personalizar…

4 horas atrás