No início desta semana, o Alibaba Group Holdings da China revelou uma nova família de modelos de linguagem emblemáticos, o Qwen3, que usa uma nova técnica de “combinação de especialistas” para alcançar resultados comparáveis ​​aos dos sistemas de raciocínio híbridos.

Fonte da imagem: Alibaba

De acordo com a Alibaba, sua família de modelos Qwen3 está no mesmo nível ou até mesmo é mais rápida e eficiente do que os desenvolvimentos da DeepSeek em diversas áreas de aplicação, incluindo resolução de problemas matemáticos e escrita de código de software. Escalar esses modelos também custa significativamente menos do que a maioria dos análogos populares. Modelos desse tipo tentam imitar as pessoas na lógica de resolução de problemas; sistemas semelhantes já foram propostos pela Anthropic e Alphabet (Google).

Uma solução mais eficiente para o problema é obtida dividindo-o em vários segmentos, cada um com seu próprio fragmento de código. Isso se assemelha ao processo de resolução de um problema por um grupo de especialistas, cada um dos quais recebe uma tarefa. Em março, o Alibaba apresentou modelos da família Qwen 2.5, que podem trabalhar com texto, imagens, áudio e vídeo, embora sejam limitados pelos recursos de hardware de um laptop ou smartphone. A família de modelos Qwen3 adere ao princípio de código aberto.

Sob pressão da DeepSeek, a startup americana OpenAI também prometeu introduzir um modelo mais aberto que imita o raciocínio humano. O esforço do Alibaba para fortalecer sua posição no mercado de inteligência artificial ajudou a gigante chinesa a emergir de uma crise causada pelo conflito entre o fundador Jack Ma e as autoridades chinesas, que há vários anos começaram a regulamentar seriamente os negócios nas áreas nas quais a prosperidade do Alibaba Group foi construída.

avalanche

Postagens recentes

A Microsoft corrigiu três vulnerabilidades zero-day perigosas e outras 200 falhas em seu software.

A Microsoft lançou sua atualização de junho na terça-feira de atualizações, corrigindo 200 vulnerabilidades, incluindo…

4 horas atrás

Inteligência artificial ajuda a atualizar drivers AMD Radeon que têm quase 20 anos.

Segundo o Phoronix, a versão mais recente do driver gráfico Gallium3D R600, incluída no Mesa…

5 horas atrás

A NASA apresentou a tripulação da missão lunar Artemis 3, mas ela não chegará à Lua.

A NASA anunciou os nomes dos astronautas que irão ao espaço na missão Artemis 3…

6 horas atrás

A NASA apresentou a tripulação da missão lunar Artemis 3, mas ela não chegará à Lua.

A NASA anunciou os nomes dos astronautas que irão ao espaço na missão Artemis 3…

6 horas atrás

A Anthropic revelou Claude Fable 5, uma “versão segura” do tão comentado Mythos.

No início deste mês, a Anthropic expandiu a disponibilidade de seu modelo de IA mais…

6 horas atrás