Cotype da MTS ficou em segundo lugar no ranking de grandes modelos de linguagem no benchmark MERA

O modelo generativo Cotype (ex.MTS AI Chat) ficou em segundo lugar no ranking de grandes modelos de linguagem na tabela de classificação do benchmark MERA (Avaliação Multimodal para Arquiteturas de Língua Russa).

Os 30 modelos de linguagem incluídos na avaliação foram avaliados de acordo com 17 parâmetros. O indicador BPS para o modelo Cotype (ex.MTS AI Chat) foi de 0,23, o PARus atingiu 0,884, e para tarefas de “O quê? Onde? Quando?” (parâmetro CheGeKa) ela apresentou resultado de 0,05 / 0,022. Isso significa que Cotype (ex.MTS AI Chat) possui o conhecimento mais completo do mundo, desenvolveu habilidades lógicas e habilidades de raciocínio de causa e efeito e bom senso.

Cotype (ex.MTS AI Chat) foi projetado para trabalhar com informações corporativas para resolver problemas de negócios. De referir que a sua criação demorou menos de um ano. Mesmo assim, ela conseguiu passar à frente de participantes mais “adultos”, como o GigaChat Pro.

avalanche

Postagens recentes

Pronto para a missão: o thriller de espionagem 007 First Light, dos criadores de Hitman, alcançou o status gold duas semanas antes do lançamento.

O ambicioso thriller de espionagem 007 First Light, da desenvolvedora dinamarquesa IO Interactive (da série…

5 horas atrás

Um asteroide do tamanho de uma casa passará perto da Terra na próxima semana – ele estará quatro vezes mais perto do que a Lua.

Na segunda-feira, 18 de maio, um asteroide descoberto há poucos dias passará perto da Terra,…

6 horas atrás

O setor de tecnologia foi atingido por uma onda de demissões, com mais de 100 mil funcionários perdendo seus empregos desde o início do ano.

No início de maio, o número de demissões no setor de tecnologia ultrapassou 100 mil…

6 horas atrás

A Microsoft corrigiu um bug no Windows Autopatch que fazia com que os drivers fossem atualizados sem permissão.

A Microsoft corrigiu um bug no Windows Autopatch que fazia com que alguns dispositivos Windows…

7 horas atrás

A primeira bateria de gravidade da África será construída na África do Sul.

A empresa estatal sul-africana de energia elétrica, Eskom, anunciou o lançamento de um dos projetos…

7 horas atrás

A Devolver Digital anunciou The Talos Principle 3, o grande final da trilogia de quebra-cabeças filosóficos dos criadores de Serious Sam.

A editora Devolver Digital e a desenvolvedora Croteam (série Serious Sam) anunciaram The Talos Principle…

7 horas atrás