O grupo russo de empresas T-Technologies, proprietário do T-Bank, publicou seu próprio modelo de reconhecimento de fala com IA de código aberto. O modelo de fala, chamado T-one, promete um novo nível de qualidade de reconhecimento, de acordo com seus desenvolvedores. Ele também promete soluções inovadoras, como reconhecimento de fala em tempo real, segundo a Forbes.

Fonte da imagem: T-Technologies

Representantes da T-Technologies falaram mais detalhadamente sobre o T-one em 19 de julho, em Moscou, na Segunda Conferência sobre Aprendizado de Máquina Turbo ML. O recurso oficial da empresa na plataforma GitHub explica que o T-one é um sistema de reconhecimento automático de fala (ASR) de alto desempenho com ênfase no reconhecimento do idioma russo em telefonia. A propósito, ele já está disponível para download no GitHub. Também pode ser baixado do Hugging Face. Os desenvolvedores recebem instruções sobre como implantar o sistema.

O T-One é um modelo relativamente pequeno, com cerca de 70 milhões de parâmetros. Para efeito de comparação, o modelo de fala do GigaAM da Sberbank consiste em 240 milhões de parâmetros, e o modelo Whisper large-v3 da OpenAI, em 1,55 bilhão. No entanto, de acordo com os desenvolvedores do T-One, isso não impede que este último ultrapasse concorrentes famosos no reconhecimento da fala russa em conversas telefônicas, para o qual é “aprimorado”.

«A T-Technologies posiciona seu desenvolvimento tanto para a comunidade empresarial quanto para a científica. Esta última se interessa pelo seu baixo custo: a operação em seu próprio servidor deve ser dezenas de vezes mais barata do que as soluções concorrentes de provedores de nuvem. A T-One se adapta bem às necessidades de uma empresa específica e ao desenvolvimento de suas próprias soluções.

«”Poderiam ser empresas que desenvolvem robôs e assistentes de voz, atuando na automação de call centers”, explicaram representantes da T-Technologies na conferência Turbo ML. “Elas podem usar esse modelo como base e adaptá-lo às suas soluções. Isso reduzirá os recursos para desenvolvimento do zero.”

admin

Postagens recentes

Índia revela o primeiro processador de 32 bits Vikram 3201 – desenvolvido e fabricado no país

Construído pelo Laboratório de Semicondutores (SCL) da Organização Indiana de Pesquisa Espacial (ISRO), o Vikram…

1 hora atrás

Trump ameaça UE com ‘retaliação’ por multas aplicadas ao Google e à Apple

O presidente dos EUA, Donald Trump, anunciou na sexta-feira sua intenção de iniciar uma investigação…

2 horas atrás

Nepal bloqueia Facebook, YouTube e X por se recusarem a abrir escritórios locais

As autoridades nepalesas anunciaram o bloqueio de vários serviços populares de mídia social, incluindo X,…

4 horas atrás