No início desta semana, o Alibaba Group Holdings da China revelou uma nova família de modelos de linguagem emblemáticos, o Qwen3, que usa uma nova técnica de “combinação de especialistas” para alcançar resultados comparáveis aos dos sistemas de raciocínio híbridos.

Fonte da imagem: Alibaba
De acordo com a Alibaba, sua família de modelos Qwen3 está no mesmo nível ou até mesmo é mais rápida e eficiente do que os desenvolvimentos da DeepSeek em diversas áreas de aplicação, incluindo resolução de problemas matemáticos e escrita de código de software. Escalar esses modelos também custa significativamente menos do que a maioria dos análogos populares. Modelos desse tipo tentam imitar as pessoas na lógica de resolução de problemas; sistemas semelhantes já foram propostos pela Anthropic e Alphabet (Google).
Uma solução mais eficiente para o problema é obtida dividindo-o em vários segmentos, cada um com seu próprio fragmento de código. Isso se assemelha ao processo de resolução de um problema por um grupo de especialistas, cada um dos quais recebe uma tarefa. Em março, o Alibaba apresentou modelos da família Qwen 2.5, que podem trabalhar com texto, imagens, áudio e vídeo, embora sejam limitados pelos recursos de hardware de um laptop ou smartphone. A família de modelos Qwen3 adere ao princípio de código aberto.
Sob pressão da DeepSeek, a startup americana OpenAI também prometeu introduzir um modelo mais aberto que imita o raciocínio humano. O esforço do Alibaba para fortalecer sua posição no mercado de inteligência artificial ajudou a gigante chinesa a emergir de uma crise causada pelo conflito entre o fundador Jack Ma e as autoridades chinesas, que há vários anos começaram a regulamentar seriamente os negócios nas áreas nas quais a prosperidade do Alibaba Group foi construída.
