Alibaba lançou modelos de linguagem matemática Qwen2-Math que são melhores que os análogos da OpenAI e do Google

O Alibaba Group Holding continua a trabalhar ativamente na área de inteligência artificial. Esta semana, a gigante do comércio eletrônico lançou vários modelos de linguagem de grande porte (LLMs) sob o nome coletivo Qwen2-Math, que se concentram na resolução de problemas matemáticos complexos e, segundo os desenvolvedores, fazem isso melhor do que algoritmos de IA de outras empresas.

Fonte da imagem: Shutterstock

No total, foram apresentados três grandes modelos de linguagem, que se diferenciam na quantidade de parâmetros que afetam a precisão das respostas do algoritmo. O modelo com mais parâmetros, Qwen2-Math-72B-Instruct, segundo os desenvolvedores, é superior a muitos algoritmos de IA em termos de resolução de problemas matemáticos, incluindo GPT-4o da OpenAI, Claude 3.5 Sonnet da Anthropic, Gemini 1.5 Pro da Google e Llama-3.1 -405B das plataformas Meta✴.

«Durante o ano passado, fizemos muito trabalho explorando e expandindo as capacidades lógicas de grandes modelos de linguagem, com foco particular em sua capacidade de resolver problemas aritméticos e matemáticos. Esperamos que o Qwen2-Math contribua para os esforços da comunidade. resolver problemas matemáticos complexos.” mensagem dos desenvolvedores.

Os modelos de linguagem do Qwen2-Math foram testados em uma variedade de benchmarks, incluindo GSM8K (8.500 problemas matemáticos complexos e variados de nível de ensino médio), OlympiadBench (um benchmark científico multimodal bilíngue de alto nível) e Gaokao (um dos mais difíceis testes de nível universitário). vestibular de matemática). Note-se que os novos modelos apresentam algumas limitações devido ao “suporte apenas para inglês”. No futuro, os desenvolvedores planejam criar LLMs bilíngues e multilíngues.

avalanche

Postagens recentes

As ações da Nvidia não têm mais o melhor desempenho – a MicroStrategy dispara 500% em um ano graças ao Bitcoin

Na última quarta-feira, o volume de negociação das ações da MicroStrategy excedeu o da Nvidia…

53 minutos atrás

Cansado de esperar: vendas de S.T.A.L.K.E.R. 2: Heart of Chornobyl ultrapassou um milhão de cópias dois dias após o lançamento

O jogo de tiro pós-apocalíptico de mundo aberto S.T.A.L.K.E.R. 2: Heart of Chornobyl dos desenvolvedores…

2 horas atrás

TSMC começará a produzir chips de 1,6 nm em dois anos

Os planos da TSMC para os próximos anos permanecem praticamente inalterados - no final de…

2 horas atrás

O YouTube adicionou o recurso Dream Screen aos Shorts – um gerador de fundo de IA para vídeos

A administração do YouTube anunciou que o recurso Dream Screen atualizado agora está disponível na…

2 horas atrás