O Alibaba introduziu um grande modelo de linguagem que ultrapassou parcialmente o GPT-4

Alibaba Cloud anunciou o lançamento de uma versão melhorada de seu grande modelo de linguagem, Qwen2.5. A nova rede neural demonstrou superioridade sobre o GPT-4 da OpenAI em alguns parâmetros, como raciocínio lógico e compreensão de texto.

Fonte da imagem: Alibaba Cloud

De acordo com Jingren Zhou, CTO da Alibaba Cloud, o novo modelo demonstra melhorias significativas no raciocínio, compreensão do código e linguagem natural em comparação com a versão anterior Qwen2.0. De acordo com uma análise da plataforma OpenCompass realizada em março, o Qwen2.5 é superior ao GPT-4 da OpenAI em termos de linguagem e capacidades criativas. Porém, é inferior em aspectos como conhecimento, raciocínio lógico e habilidade matemática.

Lembre-se de que grandes modelos de linguagem (LLM), que incluem Qwen, são usados ​​em aplicações de inteligência artificial. Eles são treinados em grandes quantidades de dados para gerar respostas às dúvidas dos usuários em linguagem natural. Após o lançamento do ChatGPT em 2022, que causou polêmica em todo o mundo, o Alibaba apresentou o Tongyi Qianwen em abril de 2023. E em outubro foi lançada uma versão atualizada com capacidades ampliadas para compreensão de instruções complexas, redação de textos, raciocínio lógico e memorização de informações.

De acordo com o Alibaba Cloud, os serviços de IA baseados em Qwen, como o DingTalk (semelhante ao Slack do Alibaba), já foram usados ​​por mais de 2,2 milhões de usuários corporativos. Além disso, a empresa apresentou uma série de modelos Qwen de código aberto à comunidade de desenvolvedores e atualizou sua plataforma generativa Model Studio com ferramentas adicionais para a criação de IA.

Na China, assim como em todo o mundo, há um boom no interesse em chatbots e modelos generativos de IA. Junto com o Alibaba, Baidu e Tencent lançaram suas soluções. Por exemplo, o chatbot Ernie do Baidu atraiu mais de 200 milhões de usuários até abril de 2023, após receber permissão para uso público em agosto de 2022.

Alibaba Cloud disse que seu modelo de linguagem Qwen2.5 atualizado foi implantado em mais de 90.000 empresas em todos os setores e pretende colaborar ainda mais com clientes e desenvolvedores para aproveitar o poder da IA ​​generativa e levar a tecnologia para o desenvolvimento de robôs humanóides na China. esses robôs serão capazes de ajudar nas fábricas e substituir o trabalho manual humano sempre que possível.

avalanche

Postagens recentes

A Nokia já está se preparando para o desenvolvimento do Wi-Fi 9.

A Nokia delineou sua visão para o futuro padrão sem fio Wi-Fi 9, projetado para…

47 minutos atrás

A Apple não abandonou os planos de lançar um iPad mais acessível com o chip A18 nesta primavera.

Contrariando as expectativas, os anúncios da Apple em março não mencionaram um iPad básico com…

2 horas atrás

A LG iniciou a produção em massa de telas para laptops com taxa de atualização variável de 1 a 120 Hz.

A LG Display anunciou o início da produção em massa dos primeiros painéis LCD do…

4 horas atrás

A LG iniciou a produção em massa de telas para laptops com taxa de atualização variável de 1 a 120 Hz.

A LG Display anunciou o início da produção em massa dos primeiros painéis LCD do…

4 horas atrás

“Destruição do Patrimônio da Humanidade” – Astrônomos protestam contra data centers e espelhos no espaço.

Astrônomos estão soando o alarme, protestando contra a implementação de dois projetos de grande escala…

5 horas atrás

Os programadores estão usando cada vez mais IA, e em algumas empresas isso se tornou até uma competição.

Algumas empresas de tecnologia criaram rankings que demonstram o quão ativamente seus funcionários usam algoritmos…

5 horas atrás