No início desta semana, o Alibaba Group Holdings da China revelou uma nova família de modelos de linguagem emblemáticos, o Qwen3, que usa uma nova técnica de “combinação de especialistas” para alcançar resultados comparáveis ​​aos dos sistemas de raciocínio híbridos.

Fonte da imagem: Alibaba

De acordo com a Alibaba, sua família de modelos Qwen3 está no mesmo nível ou até mesmo é mais rápida e eficiente do que os desenvolvimentos da DeepSeek em diversas áreas de aplicação, incluindo resolução de problemas matemáticos e escrita de código de software. Escalar esses modelos também custa significativamente menos do que a maioria dos análogos populares. Modelos desse tipo tentam imitar as pessoas na lógica de resolução de problemas; sistemas semelhantes já foram propostos pela Anthropic e Alphabet (Google).

Uma solução mais eficiente para o problema é obtida dividindo-o em vários segmentos, cada um com seu próprio fragmento de código. Isso se assemelha ao processo de resolução de um problema por um grupo de especialistas, cada um dos quais recebe uma tarefa. Em março, o Alibaba apresentou modelos da família Qwen 2.5, que podem trabalhar com texto, imagens, áudio e vídeo, embora sejam limitados pelos recursos de hardware de um laptop ou smartphone. A família de modelos Qwen3 adere ao princípio de código aberto.

Sob pressão da DeepSeek, a startup americana OpenAI também prometeu introduzir um modelo mais aberto que imita o raciocínio humano. O esforço do Alibaba para fortalecer sua posição no mercado de inteligência artificial ajudou a gigante chinesa a emergir de uma crise causada pelo conflito entre o fundador Jack Ma e as autoridades chinesas, que há vários anos começaram a regulamentar seriamente os negócios nas áreas nas quais a prosperidade do Alibaba Group foi construída.

avalanche

Postagens recentes

“Impressionante”: Modders estão trabalhando em uma recriação completa do clássico Baldur’s Gate, baseada em Baldur’s Gate 3.

O grupo de modding Deathbringer's Reign, liderado por 786r786, embarcou em uma missão ambiciosa: recriar…

17 minutos atrás

A guerra no Irã interrompeu o fornecimento de chips para a Europa, causando atrasos e aumentos de preços para os compradores.

Fontes do setor já explicaram como a situação no Oriente Médio, onde o fornecimento de…

58 minutos atrás

A Anthropic está alcançando a OpenAI no campo da IA ​​para negócios.

A Anthropic está acelerando seu crescimento no mercado de IA empresarial. Em fevereiro, suas assinaturas…

1 hora atrás

A Samsung Electronics aumentará seus investimentos em expansão da produção de chips e pesquisa em 22%, totalizando US$ 73 bilhões.

Aparentemente, as revelações da concorrente Micron Technology sobre a necessidade de aumentar drasticamente os investimentos…

1 hora atrás

The Legend of California, um faroeste multiplayer do estúdio por trás de Overwatch, estará disponível para teste em breve – detalhes do alfa público.

Os desenvolvedores do Kintsugiyama Studio, liderados por Jeff Kaplan, cocriador de Overwatch, anunciaram as datas…

2 horas atrás

A Forbes descobriu que os equipamentos da Roskomnadzor estão sobrecarregados e incapazes de lidar com o bloqueio do Telegram.

Os sistemas de filtragem de tráfego da Roskomnadzor, utilizados para restringir o acesso a recursos…

2 horas atrás