“VKontakte” aprendeu a reconhecer o texto das mensagens de áudio

Na rede social VKontakte, apareceu uma função para reconhecer o texto das mensagens de áudio. Isso foi relatado no serviço de imprensa da empresa. Até o momento, a função está disponível apenas para alguns usuários do aplicativo móvel, mas na próxima semana todos poderão usá-lo.

O reconhecimento de fala é tratado por uma rede neural desenvolvida pelos funcionários da VKontakte. Segundo os desenvolvedores, ele reconhece gírias e leva em conta as difíceis condições de gravação. Será possível processar no texto as mensagens enviadas e recebidas com duração de até 30 segundos. Além disso, a rede neural permitirá pesquisar mensagens de voz no texto especificado. No futuro, eles planejam adicionar uma função à versão desktop da rede social.

«A decodificação de mensagens de áudio é significativamente diferente do reconhecimento de fala em assistentes de voz. Eles conversam com um amigo de uma maneira completamente diferente do que com um alto-falante inteligente: as mensagens são gravadas em movimento com ruídos estranhos, muitas gírias e abreviações. Por isso, criamos três redes neurais: uma é responsável pelo reconhecimento, a segunda encontra palavras adequadas e a terceira coloca sinais de pontuação. Juntos, eles se tornarão o serviço mais carregado para reconhecimento de fala em russo ”- Pavel Kaydin, diretor de pesquisa em inteligência artificial da VKontakte.

A empresa anunciou planos para adicionar reconhecimento de voz em março. A rede social explicou a necessidade pelo fato de as mensagens de voz serem um formato de comunicação muito popular – cerca de 30 milhões de usuários as trocam mensalmente.

avalanche

Postagens recentes

A ESA lançou dois satélites Celeste em órbita para testar novas tecnologias de navegação.

A Agência Espacial Europeia (ESA) anunciou o lançamento bem-sucedido dos dois primeiros satélites da missão…

2 horas atrás

Os preços dos processadores Intel Arrow Lake Refresh subiram acima dos níveis recomendados 48 horas após o início das vendas.

No início deste mês, a Intel anunciou os processadores Arrow Lake Refresh, lançando o Core…

3 horas atrás

O Telegram afirma que não há nenhuma vulnerabilidade perigosa no aplicativo de mensagens.

O serviço de imprensa do Telegram afirmou que a vulnerabilidade crítica no aplicativo, recentemente relatada,…

4 horas atrás

As ações dos fabricantes de DRAM se estabilizam após o impacto inicial do TurboQuant.

Esta semana, o Google apresentou o TurboQuant, seu método de compressão de dados para IA,…

6 horas atrás

O lucro anual da BYD caiu pela primeira vez em quatro anos, expondo os horrores da guerra de preços na China.

A empresa chinesa BYD alcançou a liderança no mercado global de veículos elétricos, apesar de…

7 horas atrás