Legendas automáticas e transcrições de texto de chamadas foram adicionadas à plataforma VK Calls

A rede social VKontakte introduziu novas funcionalidades da plataforma VK Calls, que serão úteis para quem utiliza o serviço para comunicação empresarial ou em condições onde o silêncio é importante. Estamos falando de uma transcrição de texto das reuniões, que traduz automaticamente a trilha de áudio da reunião em texto com a preservação da chamada no chat, além de legendas automáticas que duplicam a fala dos participantes do chat.

Fonte da imagem: “VKontakte”

Qualquer um dos participantes de uma chamada em grupo pode ativar a função de transcrição de texto, enquanto os demais interlocutores receberão uma notificação sobre isso. Após a conclusão da comunicação, o arquivo de texto será enviado para o chat da chamada e será salvo em uma seção especial do perfil do usuário que habilitou a descriptografia do texto. Os códigos de tempo e os nomes dos alto-falantes são colocados automaticamente no arquivo.

Quanto às legendas automáticas, elas serão mostradas em tempo real apenas para os usuários que habilitaram esta opção. A transcrição do texto pode ser realizada simultaneamente com legendas e gravação de chamadas.

Para traduzir a fala em texto, o VKontakte usa seus próprios desenvolvimentos de rede neural, que a rede social usa para descriptografar mensagens de voz e criar legendas automáticas em vídeos. Para garantir uma decodificação de alta qualidade, o fluxo de áudio é processado em vários estágios. Primeiramente, a gravação é limpa de sons de fundo por meio de redução inteligente de ruído, após o que a rede neural reconhece as palavras, formando o texto, que é então dividido em frases de acordo com um locutor específico. As redes neurais estão em constante aprimoramento, passando por treinamentos, inclusive na fala coloquial e nas gírias reais.

Novos recursos também podem ser usados ​​em salas de descanso e chamadas comunitárias. Atualmente, as funções estão disponíveis apenas para o idioma russo, mas outros idiomas serão adicionados no futuro. Também há planos para lançar novos recursos em chamadas individuais em um futuro próximo e a capacidade do administrador configurar quais participantes da reunião podem executar a transcrição.

Conforme observado pelo VKontakte, os novos recursos serão especialmente úteis para quem utiliza VK Calls para comunicação empresarial, permitindo-lhes transcrever rapidamente entrevistas, enviar teses importantes após a reunião ou informar colegas que não estiveram na reunião sobre os resultados da reunião. chamar. As legendas serão úteis em uma situação em que o silêncio é importante e o usuário não possui fones de ouvido. “Além disso, este é um passo para a criação de um ambiente digital acessível aos deficientes auditivos: eles poderão participar de reuniões sem restrições”, enfatizou a assessoria de imprensa da rede social.

avalanche

Postagens recentes

Após anos de confusão, a CD Projekt mudará seu nome para CD Projekt Red.

Durante anos, os jogadores ficaram confusos sobre o nome correto da desenvolvedora de The Witcher…

26 minutos atrás

A OpenAI integrará o modelo de voz Bidi 1 ao ChatGPT, que poderá falar e ouvir simultaneamente.

A OpenAI pretende transformar o ChatGPT em um superaplicativo, e outra grande atualização está atualmente…

1 hora atrás

A Microsoft quebrou o sistema de conversas por e-mail no Outlook para macOS, mas prometeu corrigir o problema.

Na atualização mais recente do Outlook para macOS, versão 16.110, compilação 26061317, a Microsoft desativou…

1 hora atrás

Electronic Arts: A IA generativa levou a um aumento na criatividade dos desenvolvedores.

A Electronic Arts, editora e desenvolvedora americana, reconheceu a IA generativa como a base de…

1 hora atrás

A OneXPlayer definiu o preço do console de jogos portátil OneXPlayer 3, equipado com um processador Intel Arc G3 Extreme, a partir de US$ 1.399.

A OneXPlayer lançou uma campanha de financiamento coletivo para seu novo console portátil OneXPlayer 3,…

1 hora atrás