Alibaba lançou modelos de linguagem matemática Qwen2-Math que são melhores que os análogos da OpenAI e do Google

O Alibaba Group Holding continua a trabalhar ativamente na área de inteligência artificial. Esta semana, a gigante do comércio eletrônico lançou vários modelos de linguagem de grande porte (LLMs) sob o nome coletivo Qwen2-Math, que se concentram na resolução de problemas matemáticos complexos e, segundo os desenvolvedores, fazem isso melhor do que algoritmos de IA de outras empresas.

Fonte da imagem: Shutterstock

No total, foram apresentados três grandes modelos de linguagem, que se diferenciam na quantidade de parâmetros que afetam a precisão das respostas do algoritmo. O modelo com mais parâmetros, Qwen2-Math-72B-Instruct, segundo os desenvolvedores, é superior a muitos algoritmos de IA em termos de resolução de problemas matemáticos, incluindo GPT-4o da OpenAI, Claude 3.5 Sonnet da Anthropic, Gemini 1.5 Pro da Google e Llama-3.1 -405B das plataformas Meta✴.

«Durante o ano passado, fizemos muito trabalho explorando e expandindo as capacidades lógicas de grandes modelos de linguagem, com foco particular em sua capacidade de resolver problemas aritméticos e matemáticos. Esperamos que o Qwen2-Math contribua para os esforços da comunidade. resolver problemas matemáticos complexos.” mensagem dos desenvolvedores.

Os modelos de linguagem do Qwen2-Math foram testados em uma variedade de benchmarks, incluindo GSM8K (8.500 problemas matemáticos complexos e variados de nível de ensino médio), OlympiadBench (um benchmark científico multimodal bilíngue de alto nível) e Gaokao (um dos mais difíceis testes de nível universitário). vestibular de matemática). Note-se que os novos modelos apresentam algumas limitações devido ao “suporte apenas para inglês”. No futuro, os desenvolvedores planejam criar LLMs bilíngues e multilíngues.

avalanche

Postagens recentes

O Guinness Book of Records reconhece Garry’s Mod como o exclusivo para PC mais vendido da história

Fonte da imagem: Facepunch Studios Como ficou conhecido, os editores do Guinness Book of Records…

45 minutos atrás

O protótipo do foguete reutilizável chinês Landspace saltou 10 km e pousou com sucesso

A startup espacial privada chinesa Landspace concluiu com sucesso uma decolagem vertical e pouso vertical…

1 hora atrás

A Microsoft criou um robô para desmontar e reciclar 2 milhões de discos rígidos por ano

Discos rígidos defeituosos ou desgastados podem conter muitos dados valiosos que precisam ser excluídos sem…

1 hora atrás

Os europeus poderão baixar aplicativos em seus iPads de lojas de terceiros na próxima semana

Na próxima semana, a Apple permitirá que proprietários de iPad na União Europeia baixem aplicativos…

2 horas atrás

Intel recebeu US$ 1,9 bilhão em subsídios para construir uma fábrica na Polônia

A Comissão Europeia deu luz verde à Polónia para apoiar a abertura de uma nova…

2 horas atrás

Uma das maiores companhias aéreas dos EUA oferecerá Wi-Fi gratuito via Starlink em seus aviões em 2025

Uma das maiores companhias aéreas americanas, a United Airlines, oferecerá aos passageiros Wi-Fi gratuito em…

2 horas atrás