O Alibaba introduziu um grande modelo de linguagem que ultrapassou parcialmente o GPT-4

Alibaba Cloud anunciou o lançamento de uma versão melhorada de seu grande modelo de linguagem, Qwen2.5. A nova rede neural demonstrou superioridade sobre o GPT-4 da OpenAI em alguns parâmetros, como raciocínio lógico e compreensão de texto.

Fonte da imagem: Alibaba Cloud

De acordo com Jingren Zhou, CTO da Alibaba Cloud, o novo modelo demonstra melhorias significativas no raciocínio, compreensão do código e linguagem natural em comparação com a versão anterior Qwen2.0. De acordo com uma análise da plataforma OpenCompass realizada em março, o Qwen2.5 é superior ao GPT-4 da OpenAI em termos de linguagem e capacidades criativas. Porém, é inferior em aspectos como conhecimento, raciocínio lógico e habilidade matemática.

Lembre-se de que grandes modelos de linguagem (LLM), que incluem Qwen, são usados ​​em aplicações de inteligência artificial. Eles são treinados em grandes quantidades de dados para gerar respostas às dúvidas dos usuários em linguagem natural. Após o lançamento do ChatGPT em 2022, que causou polêmica em todo o mundo, o Alibaba apresentou o Tongyi Qianwen em abril de 2023. E em outubro foi lançada uma versão atualizada com capacidades ampliadas para compreensão de instruções complexas, redação de textos, raciocínio lógico e memorização de informações.

De acordo com o Alibaba Cloud, os serviços de IA baseados em Qwen, como o DingTalk (semelhante ao Slack do Alibaba), já foram usados ​​por mais de 2,2 milhões de usuários corporativos. Além disso, a empresa apresentou uma série de modelos Qwen de código aberto à comunidade de desenvolvedores e atualizou sua plataforma generativa Model Studio com ferramentas adicionais para a criação de IA.

Na China, assim como em todo o mundo, há um boom no interesse em chatbots e modelos generativos de IA. Junto com o Alibaba, Baidu e Tencent lançaram suas soluções. Por exemplo, o chatbot Ernie do Baidu atraiu mais de 200 milhões de usuários até abril de 2023, após receber permissão para uso público em agosto de 2022.

Alibaba Cloud disse que seu modelo de linguagem Qwen2.5 atualizado foi implantado em mais de 90.000 empresas em todos os setores e pretende colaborar ainda mais com clientes e desenvolvedores para aproveitar o poder da IA ​​generativa e levar a tecnologia para o desenvolvimento de robôs humanóides na China. esses robôs serão capazes de ajudar nas fábricas e substituir o trabalho manual humano sempre que possível.

avalanche

Postagens recentes

Indiana Jones e o Grande Círculo – chapéu fiel ao tamanho. Análise

Jogado no pc Indiana Jones e o Grande Círculo foi anunciado há vários anos, mas…

9 horas atrás

Avanços da IA ​​em 2024: descobertas arqueológicas, conversas com cachalotes e dobramento de proteínas

A inteligência artificial ou aprendizado de máquina tornou-se um tema central em muitas notícias este…

10 horas atrás