A empresa chinesa Alibaba introduziu um modelo de inteligência artificial de código aberto chamado QwQ-32B-Preview. O modelo é capaz de resolver problemas lógicos e matemáticos complexos, contém 32,5 bilhões de parâmetros e pode processar consultas de até 32 mil palavras. De acordo com testes realizados pelo Alibaba, o QwQ-32B-Preview supera os modelos o1-preview e o1-mini da OpenAI em diversas áreas.

Fonte da imagem: Copiloto

Uma das principais vantagens do QwQ-32B-Preview, conforme relatado pelo TechCrunch, é o seu desempenho nos testes AIME e MATH. O teste AIME avalia o desempenho do modelo em relação a outras inteligências artificiais, e o teste MATH é um conjunto de problemas matemáticos baseados em palavras. Graças às suas características, este bot de IA é capaz de resolver problemas complexos e quebra-cabeças lógicos. No entanto, observa-se que o QwQ-32B-Preview tem suas desvantagens: ele pode alterar inesperadamente o idioma de comunicação, ficar preso em certos pontos e lidar pior com tarefas quando o bom senso é necessário.

Um recurso interessante do QwQ-32B-Preview é a capacidade de “verificar a si mesmo”. Isto ajuda a evitar armadilhas comuns a outros sistemas de inteligência artificial, mas retarda o processo de encontrar soluções. Assim como os modelos o1 da OpenAI, o novo desenvolvimento do Alibaba resolve problemas em etapas, analisando e planejando gradualmente as próximas etapas.

Apesar do QwQ-32B-Preview estar disponível para download na plataforma Hugging Face sob a licença Apache 2.0 (software livre), que permite sua utilização para fins comerciais, o Alibaba divulgou apenas parte dos componentes do modelo, assim impedindo-nos de estudar o algoritmo dos mecanismos internos de funcionamento. Assim, apesar das afirmações sobre “abertura”, o modelo continua sendo uma opção intermediária entre sistemas fechados e abertos (licença de código aberto).

A origem chinesa do modelo também impõe certas restrições. Tal como outros desenvolvimentos da China, o QwQ-32B-Preview segue os requisitos de um regulador local, que testa a IA quanto à conformidade com “valores socialistas fundamentais”. A modelo se recusará a responder questões políticas relacionadas à China.

Vale dizer que o interesse em modelos de “raciocínio” está crescendo no contexto de uma diminuição na eficácia da abordagem tradicional para aumentar as capacidades da IA, baseada simplesmente no dimensionamento de dados e poder computacional. Empresas como OpenAI, Google e Anthropic estão cada vez mais a ver o seu progresso tecnológico lento, o que por sua vez está a encorajar os programadores a procurar novas abordagens, tais como “computação em tempo de teste”, que dão aos modelos tempo adicional para processar tarefas. Ao mesmo tempo, grandes laboratórios, incluindo o Google, estão investindo ativamente no desenvolvimento de tais tecnologias, o que confirma o seu papel fundamental no futuro da inteligência artificial.

avalanche

Postagens recentes

A Apple lançará um aplicativo Siri separado para iOS 27 e macOS 27.

Segundo Mark Gurman, da Bloomberg, a Apple planeja lançar o primeiro aplicativo Siri independente como…

2 horas atrás

A OpenAI encerrou abruptamente o Sora, o gerador viral de sátiras com IA.

A OpenAI decidiu inesperadamente encerrar seu aplicativo de criação de vídeos com inteligência artificial, o…

2 horas atrás

NVIDIA Groq 3: SRAM, desagregação, determinismo

As LPUs da Groq são fundamentalmente diferentes dos aceleradores de IA da NVIDIA, mas são…

4 horas atrás

A primeira cerveja do mundo feita com CO₂ extraído diretamente do ar ambiente foi lançada nos EUA.

Pela primeira vez no mundo, a cerveja foi carbonatada com dióxido de carbono (CO₂) capturado…

5 horas atrás