A divisão de nuvem da Yandex (Yandex Cloud) anunciou o desenvolvimento de um novo sistema baseado em aprendizado de máquina, capaz de reconhecer mais de 10 idiomas estrangeiros simultaneamente.
Fonte da imagem: Yandex
O modelo é baseado no serviço de síntese e reconhecimento Yandex SpeechKit e em uma arquitetura especializada chamada Transformer. Os algoritmos processam as palavras de entrada em paralelo e independentemente umas das outras, para que aprendam rapidamente.
O sistema reconhece a fala em qualquer tópico e em diferentes formatos: podem ser frases curtas e longas, nomes, endereços, datas, etc. O modelo é capaz de reconhecer o idioma automaticamente em um fluxo: a rede neural pode alternar entre diferentes idiomas a qualquer momento. Ao mesmo tempo, é possível dar “dicas” a ela – isso melhora a qualidade do reconhecimento.
Para treinar o modelo, foram usados enormes arrays de dados (dezenas de terabytes) de fontes profissionais, bem como dos serviços e aplicativos do próprio Yandex. A rede neural poliglota pode trabalhar com idiomas populares como inglês e francês, bem como com outros mais raros como dinamarquês, finlandês, turco e outros.
Em 23 de junho, a 67ª edição da lista TOP500 dos supercomputadores mais poderosos do…
No mês passado, as autoridades europeias apresentaram um pacote de projetos de lei com o…
A Owlcat Games, um estúdio cipriota com raízes russas, anunciou o recolhimento do seu Owlcat…
Em maio de 2024, a Comissão Europeia iniciou uma investigação sobre as Meta✴Platforms, levantando a…
Will Cathcart, que liderou o WhatsApp nos últimos sete anos, assumirá outra posição na Meta✴,…
A Mozilla lançou a atualização mais recente do navegador Firefox, a versão 152.0. Uma das…