O grupo russo de empresas T-Technologies, proprietário do T-Bank, publicou seu próprio modelo de reconhecimento de fala com IA de código aberto. O modelo de fala, chamado T-one, promete um novo nível de qualidade de reconhecimento, de acordo com seus desenvolvedores. Ele também promete soluções inovadoras, como reconhecimento de fala em tempo real, segundo a Forbes.

Fonte da imagem: T-Technologies

Representantes da T-Technologies falaram mais detalhadamente sobre o T-one em 19 de julho, em Moscou, na Segunda Conferência sobre Aprendizado de Máquina Turbo ML. O recurso oficial da empresa na plataforma GitHub explica que o T-one é um sistema de reconhecimento automático de fala (ASR) de alto desempenho com ênfase no reconhecimento do idioma russo em telefonia. A propósito, ele já está disponível para download no GitHub. Também pode ser baixado do Hugging Face. Os desenvolvedores recebem instruções sobre como implantar o sistema.

O T-One é um modelo relativamente pequeno, com cerca de 70 milhões de parâmetros. Para efeito de comparação, o modelo de fala do GigaAM da Sberbank consiste em 240 milhões de parâmetros, e o modelo Whisper large-v3 da OpenAI, em 1,55 bilhão. No entanto, de acordo com os desenvolvedores do T-One, isso não impede que este último ultrapasse concorrentes famosos no reconhecimento da fala russa em conversas telefônicas, para o qual é “aprimorado”.

«A T-Technologies posiciona seu desenvolvimento tanto para a comunidade empresarial quanto para a científica. Esta última se interessa pelo seu baixo custo: a operação em seu próprio servidor deve ser dezenas de vezes mais barata do que as soluções concorrentes de provedores de nuvem. A T-One se adapta bem às necessidades de uma empresa específica e ao desenvolvimento de suas próprias soluções.

«”Poderiam ser empresas que desenvolvem robôs e assistentes de voz, atuando na automação de call centers”, explicaram representantes da T-Technologies na conferência Turbo ML. “Elas podem usar esse modelo como base e adaptá-lo às suas soluções. Isso reduzirá os recursos para desenvolvimento do zero.”

admin

Postagens recentes

“Todos estão infelizes, exceto a gerência”: o moral na Meta atinge o nível mais baixo da história, apesar dos lucros recordes.

O moral na Meta✴ atingiu um nível historicamente baixo às vésperas da demissão de quase…

2 horas atrás

Seguindo o caminho já trilhado: a crítica deu seu veredito sobre Forza Horizon 6.

Antes de seu lançamento iminente, o ambicioso jogo de corrida arcade de mundo aberto Forza…

2 horas atrás

As placas gráficas Radeon RX 6000 e RX 7000 receberão suporte para o escalonamento AMD FSR 4.1.

A AMD atendeu aos pedidos insistentes dos jogadores para fornecer suporte à tecnologia de escalonamento…

2 horas atrás

Amazon cancela MMO de Senhor dos Anéis, mas já tem um novo jogo “emocionante”.

A pedido do Eurogamer, Jeff Grattis, chefe da divisão de jogos da Amazon, comentou sobre…

3 horas atrás

A MSI lançará uma GeForce RTX 5080 em edição muito limitada, inspirada em “The Mandalorian e Grogu”.

A MSI apresentou a placa de vídeo GeForce RTX 5080 16GB OC em uma edição…

3 horas atrás

A Anthropic afirmou que a IA já escreve mais de 90% do seu código.

É como se as empresas de tecnologia estivessem numa corrida para ver quem consegue fazer…

3 horas atrás