Na conferência anual Neural Information Processing Systems (NeurIPS), que se dedica à inteligência artificial e ao aprendizado de máquina, que acontece hoje, a Intel apresentou dois projetos que estão relacionados ao reconhecimento e transcrição da linguagem falada. O projeto People’s Speech se concentra em tarefas de “reconhecimento automático de fala”, enquanto o projeto Multilingual Spoken Words Corpus (MSWC) se concentra em “buscas por palavras-chave”.

Fonte da imagem: Intel

Dentro de cada um dos projetos, foram criados conjuntos de dados contendo uma quantidade significativa de dados de áudio e estão entre as maiores coleções em sua classe. Ambas as iniciativas foram lançadas em 2018 para identificar e compilar as 50 linguagens mais usadas do mundo em um único conjunto de dados e, em seguida, colocar essas informações em uso. Para o People’s Speech e MSWC, os engenheiros da Intel colaboraram com colegas do Alibaba, Oracle, Google, Baidu e outros.

Como parte do projeto People’s Speech, os desenvolvedores criaram um conjunto de dados que inclui dezenas de milhares de horas de áudio falado monitorado. Atualmente é um dos maiores conjuntos de dados em sua classe em inglês, licenciado para uso acadêmico e comercial e disponível para download gratuito.

Ao mesmo tempo, o MSWC é um conjunto de dados de áudio-fala contendo mais de 300 mil palavras-chave em dezenas de idiomas e disponível para dispositivos inteligentes. O conjunto de dados MSWC cobre os idiomas falados por mais de 5 bilhões de pessoas e contribui para o desenvolvimento de aplicativos de voz para um amplo público. Ambos os conjuntos de dados estarão disponíveis para os desenvolvedores.

avalanche

Postagens recentes

Honor, um robô humanoide, correu uma meia maratona mais rápido que um atleta profissional.

Na China, os robôs humanoides não estão apenas exibindo suas capacidades em apresentações festivas; sua…

2 horas atrás

A Samsung encerrou os pedidos de LPDDR4/4X e utilizará a capacidade liberada para produzir DRAM de 1 núcleo.

A Samsung Electronics anunciou oficialmente a suspensão da aceitação de novos pedidos de memória DRAM…

2 horas atrás

Após abandonar a produção de veículos elétricos, o projeto Afeela, da Sony e da Honda, continuará.

A Sony buscava há tempos aplicar sua expertise na produção de câmeras e sensores de…

2 horas atrás

O preço das ações da Intel está apenas 8% abaixo de sua máxima histórica de 2000.

Durante o pregão de sexta-feira, as ações da Intel subiram apenas 1,5%, para US$ 69,55,…

3 horas atrás

Sansão — “Problemas” Não em Nossa Casa. Resenha

Intel Core i5-10505 3.2 GHz / AMD Ryzen 5 3600 3.6 GHz, 16 GB de…

10 horas atrás