O grupo russo de empresas T-Technologies, proprietário do T-Bank, publicou seu próprio modelo de reconhecimento de fala com IA de código aberto. O modelo de fala, chamado T-one, promete um novo nível de qualidade de reconhecimento, de acordo com seus desenvolvedores. Ele também promete soluções inovadoras, como reconhecimento de fala em tempo real, segundo a Forbes.

Fonte da imagem: T-Technologies

Representantes da T-Technologies falaram mais detalhadamente sobre o T-one em 19 de julho, em Moscou, na Segunda Conferência sobre Aprendizado de Máquina Turbo ML. O recurso oficial da empresa na plataforma GitHub explica que o T-one é um sistema de reconhecimento automático de fala (ASR) de alto desempenho com ênfase no reconhecimento do idioma russo em telefonia. A propósito, ele já está disponível para download no GitHub. Também pode ser baixado do Hugging Face. Os desenvolvedores recebem instruções sobre como implantar o sistema.

O T-One é um modelo relativamente pequeno, com cerca de 70 milhões de parâmetros. Para efeito de comparação, o modelo de fala do GigaAM da Sberbank consiste em 240 milhões de parâmetros, e o modelo Whisper large-v3 da OpenAI, em 1,55 bilhão. No entanto, de acordo com os desenvolvedores do T-One, isso não impede que este último ultrapasse concorrentes famosos no reconhecimento da fala russa em conversas telefônicas, para o qual é “aprimorado”.

«A T-Technologies posiciona seu desenvolvimento tanto para a comunidade empresarial quanto para a científica. Esta última se interessa pelo seu baixo custo: a operação em seu próprio servidor deve ser dezenas de vezes mais barata do que as soluções concorrentes de provedores de nuvem. A T-One se adapta bem às necessidades de uma empresa específica e ao desenvolvimento de suas próprias soluções.

«”Poderiam ser empresas que desenvolvem robôs e assistentes de voz, atuando na automação de call centers”, explicaram representantes da T-Technologies na conferência Turbo ML. “Elas podem usar esse modelo como base e adaptá-lo às suas soluções. Isso reduzirá os recursos para desenvolvimento do zero.”

admin

Postagens recentes

Seguindo os passos da Samsung: a LG apresentará as TVs LG Gallery na CES 2026.

A LG anunciou planos para lançar uma nova categoria de televisores, a LG Gallery TV,…

31 minutos atrás

As startups de IA dos EUA arrecadaram um valor recorde de US$ 150 bilhões em financiamento este ano.

Mesmo a OpenAI, empresa que se autodenomina uma das líderes no segmento de inteligência artificial…

2 horas atrás

Intel: O Wi-Fi 8 será “sobre confiabilidade e recursos avançados”, e não “sobre velocidade”.

O padrão sem fio Wi-Fi 8 de próxima geração focará menos em aumentos de velocidade…

2 horas atrás