Na rede social VKontakte, apareceu uma função para reconhecer o texto das mensagens de áudio. Isso foi relatado no serviço de imprensa da empresa. Até o momento, a função está disponível apenas para alguns usuários do aplicativo móvel, mas na próxima semana todos poderão usá-lo.
O reconhecimento de fala é tratado por uma rede neural desenvolvida pelos funcionários da VKontakte. Segundo os desenvolvedores, ele reconhece gírias e leva em conta as difíceis condições de gravação. Será possível processar no texto as mensagens enviadas e recebidas com duração de até 30 segundos. Além disso, a rede neural permitirá pesquisar mensagens de voz no texto especificado. No futuro, eles planejam adicionar uma função à versão desktop da rede social.
«A decodificação de mensagens de áudio é significativamente diferente do reconhecimento de fala em assistentes de voz. Eles conversam com um amigo de uma maneira completamente diferente do que com um alto-falante inteligente: as mensagens são gravadas em movimento com ruídos estranhos, muitas gírias e abreviações. Por isso, criamos três redes neurais: uma é responsável pelo reconhecimento, a segunda encontra palavras adequadas e a terceira coloca sinais de pontuação. Juntos, eles se tornarão o serviço mais carregado para reconhecimento de fala em russo ”- Pavel Kaydin, diretor de pesquisa em inteligência artificial da VKontakte.
A empresa anunciou planos para adicionar reconhecimento de voz em março. A rede social explicou a necessidade pelo fato de as mensagens de voz serem um formato de comunicação muito popular – cerca de 30 milhões de usuários as trocam mensalmente.