Alibaba lançou modelos de linguagem matemática Qwen2-Math que são melhores que os análogos da OpenAI e do Google

O Alibaba Group Holding continua a trabalhar ativamente na área de inteligência artificial. Esta semana, a gigante do comércio eletrônico lançou vários modelos de linguagem de grande porte (LLMs) sob o nome coletivo Qwen2-Math, que se concentram na resolução de problemas matemáticos complexos e, segundo os desenvolvedores, fazem isso melhor do que algoritmos de IA de outras empresas.

Fonte da imagem: Shutterstock

No total, foram apresentados três grandes modelos de linguagem, que se diferenciam na quantidade de parâmetros que afetam a precisão das respostas do algoritmo. O modelo com mais parâmetros, Qwen2-Math-72B-Instruct, segundo os desenvolvedores, é superior a muitos algoritmos de IA em termos de resolução de problemas matemáticos, incluindo GPT-4o da OpenAI, Claude 3.5 Sonnet da Anthropic, Gemini 1.5 Pro da Google e Llama-3.1 -405B das plataformas Meta✴.

«Durante o ano passado, fizemos muito trabalho explorando e expandindo as capacidades lógicas de grandes modelos de linguagem, com foco particular em sua capacidade de resolver problemas aritméticos e matemáticos. Esperamos que o Qwen2-Math contribua para os esforços da comunidade. resolver problemas matemáticos complexos.” mensagem dos desenvolvedores.

Os modelos de linguagem do Qwen2-Math foram testados em uma variedade de benchmarks, incluindo GSM8K (8.500 problemas matemáticos complexos e variados de nível de ensino médio), OlympiadBench (um benchmark científico multimodal bilíngue de alto nível) e Gaokao (um dos mais difíceis testes de nível universitário). vestibular de matemática). Note-se que os novos modelos apresentam algumas limitações devido ao “suporte apenas para inglês”. No futuro, os desenvolvedores planejam criar LLMs bilíngues e multilíngues.

avalanche

Postagens recentes

“Está ficando cada vez melhor”: Os desenvolvedores de Heroes of Might & Magic: Olden Era encantaram os fãs com uma demonstração da Necrópole atualizada.

Os desenvolvedores do estúdio cipriota com raízes russas, Unfrozen, apresentaram uma nova versão da facção…

3 horas atrás

Negócio de US$ 1,25 trilhão: a SpaceX realmente adquiriu a xAI, startup de IA de Elon Musk.

O bilionário americano Elon Musk considera mais fácil administrar suas empresas privadas, já que suas…

4 horas atrás

O processador AMD Ryzen 7 9850X3D apresenta ganhos de frequência obtidos por meio de overclock de fábrica e aumento do consumo de energia.

Historicamente, a AMD é conhecida por prolongar a vida útil das plataformas de PC lançando…

5 horas atrás