Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

O Google apresentou o Gemini 3.5 Live Translate, um modelo de IA baseado em som para tradução simultânea com preservação da entonação.

O Google apresentou seu novo modelo Gemini 3.5 Live Translate, projetado para tradução de voz em tempo real. A rede neural reconhece automaticamente mais de 70 idiomas e gera traduções preservando a entonação, o ritmo e o tom originais do falante.

Fonte da imagem: Google

Ao contrário de sistemas que esperam o final de uma frase, o novo algoritmo processa o fluxo de áudio de forma síncrona. O atraso entre a fala original e a tradução é de apenas alguns segundos, eliminando pausas artificiais no diálogo. O modelo é adaptado para funcionar em ambientes ruidosos e não requer configuração manual de parâmetros adicionais. Para segurança e combate à desinformação, todas as gravações de áudio geradas são marcadas com uma marca d’água digital invisível, o SynthID.

A ferramenta já está disponível para desenvolvedores em versão prévia pública por meio da API Gemini Live e do Google AI Studio, e a integração com plataformas especializadas como Agora, LiveKit e Vision Agents permite que os desenvolvedores criem aplicativos sem a necessidade de construir sua própria infraestrutura complexa de streaming de mídia. A tecnologia também está sendo testada pelo serviço asiático de táxi e entrega Grab, que processa mais de 10 milhões de chamadas por mês, para facilitar a comunicação entre motoristas e clientes.

No segmento corporativo, a implementação do algoritmo começará este mês como parte de um teste fechado para assinantes do Google Workspace no serviço de videoconferência Google Meet. A atualização permitirá a tradução de conversas usando mais de 2.000 combinações de idiomas em uma única reunião, enquanto a versão anterior do sistema suportava apenas cinco idiomas e exigia inglês. O lançamento para empresas está previsto para o final do ano.

Usuários comuns terão acesso ao recurso por meio de uma atualização global do aplicativo Google Tradutor para iOS e Android. O sistema reproduzirá o texto traduzido quando fones de ouvido forem conectados.Fale diretamente com a outra pessoa. Os usuários de dispositivos Android também contam com um “modo de escuta” especial que permite ouvir a tradução diretamente pelo alto-falante do telefone. Como o Google explica em sua postagem no blog, esse recurso pode ser útil em situações em que “você precisa ouvir a tradução rapidamente sem alertar os outros e não tem fones de ouvido à mão”.

admin

Próximo A Microsoft corrigiu três vulnerabilidades zero-day perigosas e outras 200 falhas em seu software. »

Anterior « O Google apresentou o Gemini 3.5 Live Translate, um modelo de IA baseado em som para tradução simultânea com preservação da entonação.

Deixar comentário

Publicado por

admin

15 horas atrás

Postagens recentes

Programas

A Waymo criou um motorista virtual para testar a resposta do piloto automático a incidentes na estrada.

A Waymo criou um motorista virtual para estudar como os humanos reagem a incidentes inesperados…

44 minutos atrás

Mercado de TI

A Lenovo aumentará os preços dos PCs no próximo mês pela segunda vez este ano.

A dinâmica dos preços dos chips de memória deixa os fabricantes com poucas opções quando…

44 minutos atrás

Na vanguarda da ciência

A Commonwealth Fusion explica por que seu reator de fusão será o primeiro a entrar em operação.

Muitas incógnitas permanecem em relação ao lançamento do primeiro reator de fusão autossustentável do mundo.…

44 minutos atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

O ChatGPT começou a recomendar lojas falsas e fraudulentas, e os usuários perderam dinheiro.

O ChatGPT começou a oferecer aos usuários links para lojas online falsas criadas por golpistas…

2 horas atrás

Mercado de TI

A receita da TSMC em maio aumentou 30%, impulsionada pelo boom da inteligência artificial.

Faltando duas semanas para o fim do segundo trimestre, a fabricante taiwanesa de chips TSMC…

2 horas atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

Smartphones OnePlus Turbo 6X e 6X Pro com baterias de até 8000 mAh são apresentados.

A OnePlus apresentou sua nova série de smartphones Turbo 6X na China. Ela inclui o…

2 horas atrás