Google introduziu codecs de áudio lyra para chamadas de voz em canais de comunicação muito lentos

O Google introduziu a versão beta do codec de áudio Lyra, que usa a aprendizagem de máquinas para atingir a máxima qualidade de transmissão de fala, mesmo ao usar canais de comunicação muito lentos. Código fonte Lyra, bem como exemplos de seu trabalho, a empresa publicada na plataforma GitHub. Note-se que, para a transferência de som não tratado, é necessário um canal de comunicação a uma velocidade de apenas 3 kbps.

O código Lyra é escrito em C ++ usando a estrutura de Bazel. Na versão atual do codec de áudio, a biblioteca proprietária libsparse_inference.so é usada para implementar o kernel para computação matemática em um ambiente de instrução especializado disponível em processadores de braços de 64 bits. A empresa observa que esta é uma medida temporária e no futuro é planejada para desenvolver um substituto aberto para a biblioteca acima e fornecer suporte para várias plataformas.

O codec consiste em codificador e decodificador. O primeiro algoritmo é extrair parâmetros de dados de voz a cada 40 milissegundos, sua compressão e transmissão para o destinatário pela rede. A tarefa decodificador é reduzida para converter essas porções de dados de volta a uma onda sonora, que pode ser reproduzida na lateral do ouvinte.

De acordo com o Google, a arquitetura de Lyra é mais como a arquitetura de codecs de áudio tradicionais usando técnicas de compressão sólidas convencionais. A vantagem de Lyra é a capacidade do decodificador para restaurar um sinal de alta qualidade usando um sistema gerador de aprendizagem de máquina. Ele permite recriar as informações que faltam com base nas características típicas do discurso. O modelo para gerar o som é treinado com base em várias milhares de horas com registros de votos em mais de 70 idiomas.

De acordo com o Google, os codecs de áudio Lyra podem ser aplicados em diferentes esferas. Por exemplo, ele pode ser usado para arquivar grandes volumes de gravação de fala, para economizar carga da bateria em smartphones, bem como reduzir a carga na rede em casos de situações de emergência.

avalanche

Postagens recentes

Ação clássica, sem IA e com modo multijogador garantido por muitos anos: os desenvolvedores de Serious Sam: Shatterverse respondem às perguntas dos jogadores.

Os desenvolvedores do estúdio canadense Behaviour Interactive (Dead by Daylight) responderam às perguntas mais frequentes…

33 minutos atrás

A Tesla ultrapassou a BYD em remessas de veículos elétricos pela primeira vez desde o final de 2024.

O poder das montadoras chinesas parecia confirmado pela ascensão da BYD como a maior fornecedora…

1 hora atrás

Darkest Dungeon: Ascenders: Beyond the Peak, um implacável jogo de estratégia por turnos sobre alpinistas, foi anunciado.

Os desenvolvedores do estúdio francês Ludogram, com o apoio da editora Twin Sails Interactive, lançaram…

1 hora atrás

O Google atualizou seu editor de vídeos Vids com os modelos de IA mais recentes da Veo e da Lyria, e adicionou avatares controlados por IA.

O Google continua a desenvolver ativamente seu editor de vídeo proprietário, o Vids. Desta vez,…

2 horas atrás

A primeira telha solar do mundo com película de perovskita flexível e eficiência de 12,4% foi desenvolvida na Holanda.

A primeira telha solar do mundo feita com películas finas de perovskita foi desenvolvida na…

3 horas atrás