O Alibaba Group Holding continua a trabalhar ativamente na área de inteligência artificial. Esta semana, a gigante do comércio eletrônico lançou vários modelos de linguagem de grande porte (LLMs) sob o nome coletivo Qwen2-Math, que se concentram na resolução de problemas matemáticos complexos e, segundo os desenvolvedores, fazem isso melhor do que algoritmos de IA de outras empresas.
Fonte da imagem: Shutterstock
No total, foram apresentados três grandes modelos de linguagem, que se diferenciam na quantidade de parâmetros que afetam a precisão das respostas do algoritmo. O modelo com mais parâmetros, Qwen2-Math-72B-Instruct, segundo os desenvolvedores, é superior a muitos algoritmos de IA em termos de resolução de problemas matemáticos, incluindo GPT-4o da OpenAI, Claude 3.5 Sonnet da Anthropic, Gemini 1.5 Pro da Google e Llama-3.1 -405B das plataformas Meta✴.
«Durante o ano passado, fizemos muito trabalho explorando e expandindo as capacidades lógicas de grandes modelos de linguagem, com foco particular em sua capacidade de resolver problemas aritméticos e matemáticos. Esperamos que o Qwen2-Math contribua para os esforços da comunidade. resolver problemas matemáticos complexos.” mensagem dos desenvolvedores.
Os modelos de linguagem do Qwen2-Math foram testados em uma variedade de benchmarks, incluindo GSM8K (8.500 problemas matemáticos complexos e variados de nível de ensino médio), OlympiadBench (um benchmark científico multimodal bilíngue de alto nível) e Gaokao (um dos mais difíceis testes de nível universitário). vestibular de matemática). Note-se que os novos modelos apresentam algumas limitações devido ao “suporte apenas para inglês”. No futuro, os desenvolvedores planejam criar LLMs bilíngues e multilíngues.
A xAI lançou uma grande atualização para sua ferramenta de geração de vídeos, Grok Imagine…
Os desenvolvedores do estúdio francês The Game Bakers (Furi, Haven) relataram sucesso de vendas para…
Elon Musk confirmou que está negociando ativamente uma fusão entre suas empresas, SpaceX e xAI.…
O estúdio polonês CD Projekt Red não tem pressa em compartilhar detalhes sobre o aguardado…
Seis meses depois, a Microsoft corrigiu um problema conhecido em que a opção de login…
O lançamento do ambicioso jogo de terror Resident Evil Requiem marcará o grande retorno do…