O Alibaba introduziu um grande modelo de linguagem que ultrapassou parcialmente o GPT-4

Alibaba Cloud anunciou o lançamento de uma versão melhorada de seu grande modelo de linguagem, Qwen2.5. A nova rede neural demonstrou superioridade sobre o GPT-4 da OpenAI em alguns parâmetros, como raciocínio lógico e compreensão de texto.

Fonte da imagem: Alibaba Cloud

De acordo com Jingren Zhou, CTO da Alibaba Cloud, o novo modelo demonstra melhorias significativas no raciocínio, compreensão do código e linguagem natural em comparação com a versão anterior Qwen2.0. De acordo com uma análise da plataforma OpenCompass realizada em março, o Qwen2.5 é superior ao GPT-4 da OpenAI em termos de linguagem e capacidades criativas. Porém, é inferior em aspectos como conhecimento, raciocínio lógico e habilidade matemática.

Lembre-se de que grandes modelos de linguagem (LLM), que incluem Qwen, são usados ​​em aplicações de inteligência artificial. Eles são treinados em grandes quantidades de dados para gerar respostas às dúvidas dos usuários em linguagem natural. Após o lançamento do ChatGPT em 2022, que causou polêmica em todo o mundo, o Alibaba apresentou o Tongyi Qianwen em abril de 2023. E em outubro foi lançada uma versão atualizada com capacidades ampliadas para compreensão de instruções complexas, redação de textos, raciocínio lógico e memorização de informações.

De acordo com o Alibaba Cloud, os serviços de IA baseados em Qwen, como o DingTalk (semelhante ao Slack do Alibaba), já foram usados ​​por mais de 2,2 milhões de usuários corporativos. Além disso, a empresa apresentou uma série de modelos Qwen de código aberto à comunidade de desenvolvedores e atualizou sua plataforma generativa Model Studio com ferramentas adicionais para a criação de IA.

Na China, assim como em todo o mundo, há um boom no interesse em chatbots e modelos generativos de IA. Junto com o Alibaba, Baidu e Tencent lançaram suas soluções. Por exemplo, o chatbot Ernie do Baidu atraiu mais de 200 milhões de usuários até abril de 2023, após receber permissão para uso público em agosto de 2022.

Alibaba Cloud disse que seu modelo de linguagem Qwen2.5 atualizado foi implantado em mais de 90.000 empresas em todos os setores e pretende colaborar ainda mais com clientes e desenvolvedores para aproveitar o poder da IA ​​generativa e levar a tecnologia para o desenvolvimento de robôs humanóides na China. esses robôs serão capazes de ajudar nas fábricas e substituir o trabalho manual humano sempre que possível.

avalanche

Postagens recentes

Astrônomos mediram pela primeira vez a massa de um planeta errante – um mundo alienígena em escuridão eterna.

Um dos primeiros artigos de astronomia do novo ano de 2026 é dedicado à primeira…

20 minutos atrás

Os preços das placas gráficas Nvidia GeForce RTX 5090 subiram, ultrapassando a marca de US$ 3.000.

Em 2026, os preços da placa gráfica GeForce RTX 5090, carro-chefe da Nvidia, já bateram…

20 minutos atrás

Diante da escassez de memória, Apple, Lenovo, Asus e Dell são as que estão se saindo melhor.

Em comparação com o ano passado, os preços da memória RAM estão atualmente apresentando um…

45 minutos atrás

Em meio às restrições dos EUA, a Baidu solicitou uma oferta pública inicial (IPO) de sua divisão de chips, a Kunlunxin.

A Baidu pretende desmembrar e listar sua divisão de semicondutores, a Kunlunxin, especializada em chips…

45 minutos atrás

A Samsung se recuperou do fiasco do HBM3E e afirma que os clientes estão satisfeitos com o HBM4.

Segundo a Reuters, citando Jun-Young-hyun, executivo sênior da empresa sul-coreana, os clientes da Samsung Electronics…

57 minutos atrás

Cientistas chineses anunciaram a descoberta do dispositivo programável mais antigo do mundo, datado de 2.000 anos atrás.

Até então, o Mecanismo de Anticítera, um dispositivo astronômico e de navegação, era considerado o…

1 hora atrás