Google introduziu codecs de áudio lyra para chamadas de voz em canais de comunicação muito lentos

O Google introduziu a versão beta do codec de áudio Lyra, que usa a aprendizagem de máquinas para atingir a máxima qualidade de transmissão de fala, mesmo ao usar canais de comunicação muito lentos. Código fonte Lyra, bem como exemplos de seu trabalho, a empresa publicada na plataforma GitHub. Note-se que, para a transferência de som não tratado, é necessário um canal de comunicação a uma velocidade de apenas 3 kbps.

O código Lyra é escrito em C ++ usando a estrutura de Bazel. Na versão atual do codec de áudio, a biblioteca proprietária libsparse_inference.so é usada para implementar o kernel para computação matemática em um ambiente de instrução especializado disponível em processadores de braços de 64 bits. A empresa observa que esta é uma medida temporária e no futuro é planejada para desenvolver um substituto aberto para a biblioteca acima e fornecer suporte para várias plataformas.

O codec consiste em codificador e decodificador. O primeiro algoritmo é extrair parâmetros de dados de voz a cada 40 milissegundos, sua compressão e transmissão para o destinatário pela rede. A tarefa decodificador é reduzida para converter essas porções de dados de volta a uma onda sonora, que pode ser reproduzida na lateral do ouvinte.

De acordo com o Google, a arquitetura de Lyra é mais como a arquitetura de codecs de áudio tradicionais usando técnicas de compressão sólidas convencionais. A vantagem de Lyra é a capacidade do decodificador para restaurar um sinal de alta qualidade usando um sistema gerador de aprendizagem de máquina. Ele permite recriar as informações que faltam com base nas características típicas do discurso. O modelo para gerar o som é treinado com base em várias milhares de horas com registros de votos em mais de 70 idiomas.

De acordo com o Google, os codecs de áudio Lyra podem ser aplicados em diferentes esferas. Por exemplo, ele pode ser usado para arquivar grandes volumes de gravação de fala, para economizar carga da bateria em smartphones, bem como reduzir a carga na rede em casos de situações de emergência.

avalanche

Postagens recentes

O investimento da Microsoft na OpenAI ultrapassará os 100 bilhões de dólares no próximo mês.

Ao discutir anteriormente o financiamento da Microsoft à OpenAI, a referência usual era aos US$…

24 minutos atrás

O Google está desenvolvendo um recurso para tradução simultânea de fala sem conexão com a internet.

O Google fez avanços significativos na tecnologia de tradução automática, abrangendo inúmeros pares de idiomas…

1 hora atrás

A Apple ainda permitirá agentes de IA autônomos na App Store, mas com restrições.

A Apple está explorando a possibilidade de permitir agentes de IA autônomos na App Store,…

2 horas atrás

De acordo com a Anthropic, a IA será capaz de antecipar as necessidades dos usuários em um futuro próximo.

A diretora executiva da Anthropic, Cat Wu, anunciou a iminente transição dos sistemas de inteligência…

2 horas atrás

A China lançou um experimento com embriões humanos artificiais na estação orbital.

A China lançou o primeiro experimento orbital do mundo para estudar o desenvolvimento de embriões…

2 horas atrás

Pronto para a missão: o thriller de espionagem 007 First Light, dos criadores de Hitman, alcançou o status gold duas semanas antes do lançamento.

O ambicioso thriller de espionagem 007 First Light, da desenvolvedora dinamarquesa IO Interactive (da série…

9 horas atrás