O grupo russo de empresas T-Technologies, proprietário do T-Bank, publicou seu próprio modelo de reconhecimento de fala com IA de código aberto. O modelo de fala, chamado T-one, promete um novo nível de qualidade de reconhecimento, de acordo com seus desenvolvedores. Ele também promete soluções inovadoras, como reconhecimento de fala em tempo real, segundo a Forbes.

Fonte da imagem: T-Technologies

Representantes da T-Technologies falaram mais detalhadamente sobre o T-one em 19 de julho, em Moscou, na Segunda Conferência sobre Aprendizado de Máquina Turbo ML. O recurso oficial da empresa na plataforma GitHub explica que o T-one é um sistema de reconhecimento automático de fala (ASR) de alto desempenho com ênfase no reconhecimento do idioma russo em telefonia. A propósito, ele já está disponível para download no GitHub. Também pode ser baixado do Hugging Face. Os desenvolvedores recebem instruções sobre como implantar o sistema.

O T-One é um modelo relativamente pequeno, com cerca de 70 milhões de parâmetros. Para efeito de comparação, o modelo de fala do GigaAM da Sberbank consiste em 240 milhões de parâmetros, e o modelo Whisper large-v3 da OpenAI, em 1,55 bilhão. No entanto, de acordo com os desenvolvedores do T-One, isso não impede que este último ultrapasse concorrentes famosos no reconhecimento da fala russa em conversas telefônicas, para o qual é “aprimorado”.

«A T-Technologies posiciona seu desenvolvimento tanto para a comunidade empresarial quanto para a científica. Esta última se interessa pelo seu baixo custo: a operação em seu próprio servidor deve ser dezenas de vezes mais barata do que as soluções concorrentes de provedores de nuvem. A T-One se adapta bem às necessidades de uma empresa específica e ao desenvolvimento de suas próprias soluções.

«”Poderiam ser empresas que desenvolvem robôs e assistentes de voz, atuando na automação de call centers”, explicaram representantes da T-Technologies na conferência Turbo ML. “Elas podem usar esse modelo como base e adaptá-lo às suas soluções. Isso reduzirá os recursos para desenvolvimento do zero.”

admin

Postagens recentes

A startup de Jim Keller planeja colocar fábricas de chips em uma linha de montagem.

A Atomic Semi, fundada pelo renomado arquiteto de processadores Jim Keller e pelo engenheiro Sam…

7 horas atrás

A abundância de inteligência artificial continua a impulsionar a Foxconn, com a receita a subir quase 40% no segundo trimestre.

A Foxconn, empresa taiwanesa e maior fabricante mundial de eletrônicos sob contrato, registrou um aumento…

9 horas atrás

Um ex-engenheiro da Microsoft conseguiu fazer um motor Stirling funcionar usando o calor de um processador AMD Threadripper.

Dave Plummer, desenvolvedor veterano da Microsoft e criador de vários componentes essenciais do Windows, incluindo…

10 horas atrás

A Sony estava desenvolvendo um controle DualShock com o primeiro PlayStation integrado, mas o projeto foi cancelado.

Um ex-desenvolvedor da Sony apresentou um protótipo do console PlayStation Puga, que nunca chegou ao…

12 horas atrás

Os robôs ainda têm muito espaço para melhorar antes de se tornarem vizinhos seguros para os humanos.

Os desenvolvedores de robôs humanoides estão ansiosos para demonstrar progressos significativos em seu desenvolvimento, mas,…

18 horas atrás