Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

O Google apresentou o Gemini 3.5 Live Translate, um modelo de IA baseado em som para tradução simultânea com preservação da entonação.

O Google apresentou seu novo modelo Gemini 3.5 Live Translate, projetado para tradução de voz em tempo real. A rede neural reconhece automaticamente mais de 70 idiomas e gera traduções preservando a entonação, o ritmo e o tom originais do falante.

Fonte da imagem: Google

Ao contrário de sistemas que esperam o final de uma frase, o novo algoritmo processa o fluxo de áudio de forma síncrona. O atraso entre a fala original e a tradução é de apenas alguns segundos, eliminando pausas artificiais no diálogo. O modelo é adaptado para funcionar em ambientes ruidosos e não requer configuração manual de parâmetros adicionais. Para segurança e combate à desinformação, todas as gravações de áudio geradas são marcadas com uma marca d’água digital invisível, o SynthID.

A ferramenta já está disponível para desenvolvedores em versão prévia pública por meio da API Gemini Live e do Google AI Studio, e a integração com plataformas especializadas como Agora, LiveKit e Vision Agents permite que os desenvolvedores criem aplicativos sem a necessidade de construir sua própria infraestrutura complexa de streaming de mídia. A tecnologia também está sendo testada pelo serviço asiático de táxi e entrega Grab, que processa mais de 10 milhões de chamadas por mês, para facilitar a comunicação entre motoristas e clientes.

No segmento corporativo, a implementação do algoritmo começará este mês como parte de um teste fechado para assinantes do Google Workspace no serviço de videoconferência Google Meet. A atualização permitirá a tradução de conversas usando mais de 2.000 combinações de idiomas em uma única reunião, enquanto a versão anterior do sistema suportava apenas cinco idiomas e exigia inglês. O lançamento para empresas está previsto para o final do ano.

Usuários comuns terão acesso ao recurso por meio de uma atualização global do aplicativo Google Tradutor para iOS e Android. O sistema reproduzirá o texto traduzido quando fones de ouvido forem conectados.Fale diretamente com a outra pessoa. Os usuários de dispositivos Android também contam com um “modo de escuta” especial que permite ouvir a tradução diretamente pelo alto-falante do telefone. Como o Google explica em sua postagem no blog, esse recurso pode ser útil em situações em que “você precisa ouvir a tradução rapidamente sem alertar os outros e não tem fones de ouvido à mão”.

admin

Próximo O Google apresentou o Gemini 3.5 Live Translate, um modelo de IA baseado em som para tradução simultânea com preservação da entonação. »

Anterior « Inteligência artificial ajuda a atualizar drivers AMD Radeon que têm quase 20 anos.

Deixar comentário

Publicado por

admin

3 semanas atrás

Postagens recentes

Servidores, clusters, supercomputadores, computadores industriais e multiprocessadores

O escritório da Supermicro em Taiwan foi alvo de uma operação policial relacionada a uma investigação sobre contrabando de servidores para a China.

As autoridades taiwanesas estão avançando firmemente na investigação sobre o suposto contrabando de aceleradores de…

1 hora atrás

Aplicativos Android

O WhatsApp agora oferece apelidos para ocultar números de telefone – as reservas já estão disponíveis.

O WhatsApp adicionou um recurso de nome de usuário para ocultar números de telefone. O…

5 horas atrás

Jogos

Calendário de lançamentos: 29 de junho a 5 de julho: Undergrounded, Monopoly: Star Wars Heróis vs. Vilões

A virada de junho para julho trouxe poucos lançamentos importantes, mas muitas atualizações e relançamentos…

6 horas atrás

Placas de vídeo

A GeForce RTX 3060 começou a retornar às lojas na Europa e nos EUA.

As placas de vídeo GeForce RTX 3060 começaram a retornar aos mercados ocidentais. Os modelos…

7 horas atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

As autoridades americanas ofereceram uma recompensa de 10 milhões de dólares por informações sobre hackers que têm como alvo usuários do WhatsApp e do Signal.

O Departamento de Estado dos EUA ofereceu uma recompensa de até US$ 10 milhões por…

7 horas atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

O Nothing Phone (4b) foi apresentado em fotos reais e suas principais especificações foram reveladas.

A Nothing apresentará seu novo smartphone Nothing Phone (4b) em 7 de julho. Embora a…

7 horas atrás