Alibaba lançou modelos de linguagem matemática Qwen2-Math que são melhores que os análogos da OpenAI e do Google

O Alibaba Group Holding continua a trabalhar ativamente na área de inteligência artificial. Esta semana, a gigante do comércio eletrônico lançou vários modelos de linguagem de grande porte (LLMs) sob o nome coletivo Qwen2-Math, que se concentram na resolução de problemas matemáticos complexos e, segundo os desenvolvedores, fazem isso melhor do que algoritmos de IA de outras empresas.

Fonte da imagem: Shutterstock

No total, foram apresentados três grandes modelos de linguagem, que se diferenciam na quantidade de parâmetros que afetam a precisão das respostas do algoritmo. O modelo com mais parâmetros, Qwen2-Math-72B-Instruct, segundo os desenvolvedores, é superior a muitos algoritmos de IA em termos de resolução de problemas matemáticos, incluindo GPT-4o da OpenAI, Claude 3.5 Sonnet da Anthropic, Gemini 1.5 Pro da Google e Llama-3.1 -405B das plataformas Meta✴.

«Durante o ano passado, fizemos muito trabalho explorando e expandindo as capacidades lógicas de grandes modelos de linguagem, com foco particular em sua capacidade de resolver problemas aritméticos e matemáticos. Esperamos que o Qwen2-Math contribua para os esforços da comunidade. resolver problemas matemáticos complexos.” mensagem dos desenvolvedores.

Os modelos de linguagem do Qwen2-Math foram testados em uma variedade de benchmarks, incluindo GSM8K (8.500 problemas matemáticos complexos e variados de nível de ensino médio), OlympiadBench (um benchmark científico multimodal bilíngue de alto nível) e Gaokao (um dos mais difíceis testes de nível universitário). vestibular de matemática). Note-se que os novos modelos apresentam algumas limitações devido ao “suporte apenas para inglês”. No futuro, os desenvolvedores planejam criar LLMs bilíngues e multilíngues.

avalanche

Postagens recentes

Centenas de funcionários do Google e da OpenAI apoiaram a Anthropic em seu impasse com o Pentágono.

Esta semana foi marcada por um escândalo envolvendo a Anthropic e seu cliente governamental, o…

40 minutos atrás

A Archer Aviation utilizará satélites Starlink da SpaceX para fornecer conectividade a táxis aéreos.

A Archer Aviation, desenvolvedora de aeronaves elétricas de decolagem e pouso vertical (eVTOL), anunciou uma…

7 horas atrás

Resident Evil 30º Aniversário: Uma Jornada Comemorativa pela Série. Parte 1 / Jogos

É assustador pensar, mas Resident Evil completa 30 anos este ano. É ainda mais assustador…

8 horas atrás

Resident Evil 30º Aniversário: Uma Jornada Comemorativa pela Série. Parte 1

É assustador pensar, mas Resident Evil completa 30 anos este ano. É ainda mais assustador…

8 horas atrás

A audiência do ChatGPT cresceu para 900 milhões de usuários por semana.

A OpenAI anunciou que o ChatGPT atingiu 900 milhões de usuários ativos semanais, indicando que…

9 horas atrás