Google introduziu codecs de áudio lyra para chamadas de voz em canais de comunicação muito lentos

O Google introduziu a versão beta do codec de áudio Lyra, que usa a aprendizagem de máquinas para atingir a máxima qualidade de transmissão de fala, mesmo ao usar canais de comunicação muito lentos. Código fonte Lyra, bem como exemplos de seu trabalho, a empresa publicada na plataforma GitHub. Note-se que, para a transferência de som não tratado, é necessário um canal de comunicação a uma velocidade de apenas 3 kbps.

O código Lyra é escrito em C ++ usando a estrutura de Bazel. Na versão atual do codec de áudio, a biblioteca proprietária libsparse_inference.so é usada para implementar o kernel para computação matemática em um ambiente de instrução especializado disponível em processadores de braços de 64 bits. A empresa observa que esta é uma medida temporária e no futuro é planejada para desenvolver um substituto aberto para a biblioteca acima e fornecer suporte para várias plataformas.

O codec consiste em codificador e decodificador. O primeiro algoritmo é extrair parâmetros de dados de voz a cada 40 milissegundos, sua compressão e transmissão para o destinatário pela rede. A tarefa decodificador é reduzida para converter essas porções de dados de volta a uma onda sonora, que pode ser reproduzida na lateral do ouvinte.

De acordo com o Google, a arquitetura de Lyra é mais como a arquitetura de codecs de áudio tradicionais usando técnicas de compressão sólidas convencionais. A vantagem de Lyra é a capacidade do decodificador para restaurar um sinal de alta qualidade usando um sistema gerador de aprendizagem de máquina. Ele permite recriar as informações que faltam com base nas características típicas do discurso. O modelo para gerar o som é treinado com base em várias milhares de horas com registros de votos em mais de 70 idiomas.

De acordo com o Google, os codecs de áudio Lyra podem ser aplicados em diferentes esferas. Por exemplo, ele pode ser usado para arquivar grandes volumes de gravação de fala, para economizar carga da bateria em smartphones, bem como reduzir a carga na rede em casos de situações de emergência.

avalanche

Postagens recentes

A Nvidia demonstrou a tecnologia RTX Mega Geometry em The Witcher 4 — em uma RTX 5090, a demonstração técnica alcançou 80 fps em 4K com DLSS.

A Nvidia divulgou a gravação completa de sua apresentação na GDC 2026, mostrando a tecnologia…

34 minutos atrás

A OpenAI decidiu repentinamente gastar mais de cem milhões de dólares para comprar um programa de entrevistas popular.

Ao que tudo indicava, o abandono de áreas de desenvolvimento secundárias, incluindo o fim do…

3 horas atrás

A IBM está criando laços entre mainframes e arquiteturas Arm, mas parece não entender completamente o porquê.

A IBM anunciou uma colaboração estratégica com a Arm para "desenvolver um novo hardware de…

9 horas atrás

O Caminho Óctuplo para a IAG: Do Falso Nirvana ao Verdadeiro Nirvana / Inteligência Artificial

Qualquer pessoa não budista que tenha ao menos vagamente ouvido falar desse antigo ensinamento sabe…

11 horas atrás