Alibaba lançou modelos de linguagem matemática Qwen2-Math que são melhores que os análogos da OpenAI e do Google

O Alibaba Group Holding continua a trabalhar ativamente na área de inteligência artificial. Esta semana, a gigante do comércio eletrônico lançou vários modelos de linguagem de grande porte (LLMs) sob o nome coletivo Qwen2-Math, que se concentram na resolução de problemas matemáticos complexos e, segundo os desenvolvedores, fazem isso melhor do que algoritmos de IA de outras empresas.

Fonte da imagem: Shutterstock

No total, foram apresentados três grandes modelos de linguagem, que se diferenciam na quantidade de parâmetros que afetam a precisão das respostas do algoritmo. O modelo com mais parâmetros, Qwen2-Math-72B-Instruct, segundo os desenvolvedores, é superior a muitos algoritmos de IA em termos de resolução de problemas matemáticos, incluindo GPT-4o da OpenAI, Claude 3.5 Sonnet da Anthropic, Gemini 1.5 Pro da Google e Llama-3.1 -405B das plataformas Meta✴.

«Durante o ano passado, fizemos muito trabalho explorando e expandindo as capacidades lógicas de grandes modelos de linguagem, com foco particular em sua capacidade de resolver problemas aritméticos e matemáticos. Esperamos que o Qwen2-Math contribua para os esforços da comunidade. resolver problemas matemáticos complexos.” mensagem dos desenvolvedores.

Os modelos de linguagem do Qwen2-Math foram testados em uma variedade de benchmarks, incluindo GSM8K (8.500 problemas matemáticos complexos e variados de nível de ensino médio), OlympiadBench (um benchmark científico multimodal bilíngue de alto nível) e Gaokao (um dos mais difíceis testes de nível universitário). vestibular de matemática). Note-se que os novos modelos apresentam algumas limitações devido ao “suporte apenas para inglês”. No futuro, os desenvolvedores planejam criar LLMs bilíngues e multilíngues.

avalanche

Postagens recentes

Pela primeira vez na história, o CERN transporta antimatéria por caminhão.

Em 24 de março de 2026, o experimento BASE no CERN alcançou um feito histórico:…

2 horas atrás

Fim de uma era: a Xiaomi descontinuou a MIUI, a interface que tornou a empresa famosa.

A Xiaomi encerrou oficialmente o suporte para a MIUI, que já foi uma das interfaces…

3 horas atrás

A Apple lançou o iOS 26.4 e o iPadOS 26.4 com novos emojis e recursos.

As versões estáveis ​​do iOS 26.4 e do iPadOS 26.4 foram lançadas, seis semanas após…

3 horas atrás

As vendas de Marathon atingiram 1,2 milhão de cópias em três semanas, mas a Sony esperava mais.

Os desenvolvedores do estúdio americano Bungie (pertencente à Sony) estão relutantes em divulgar os números…

3 horas atrás

Meta mentiu sobre a segurança do Facebook, Instagram e WhatsApp para crianças; tribunal a multou em US$ 375 milhões.

Um júri do Novo México considerou a Meta culpada de violar a lei estadual em…

4 horas atrás

A escassez de processadores para PC está se agravando, com preços em alta e prazos de entrega já estendidos por meses.

Os preços da memória começaram a subir para os consumidores no segundo semestre do ano…

4 horas atrás