A empresa chinesa Alibaba introduziu um modelo de inteligência artificial de código aberto chamado QwQ-32B-Preview. O modelo é capaz de resolver problemas lógicos e matemáticos complexos, contém 32,5 bilhões de parâmetros e pode processar consultas de até 32 mil palavras. De acordo com testes realizados pelo Alibaba, o QwQ-32B-Preview supera os modelos o1-preview e o1-mini da OpenAI em diversas áreas.

Fonte da imagem: Copiloto

Uma das principais vantagens do QwQ-32B-Preview, conforme relatado pelo TechCrunch, é o seu desempenho nos testes AIME e MATH. O teste AIME avalia o desempenho do modelo em relação a outras inteligências artificiais, e o teste MATH é um conjunto de problemas matemáticos baseados em palavras. Graças às suas características, este bot de IA é capaz de resolver problemas complexos e quebra-cabeças lógicos. No entanto, observa-se que o QwQ-32B-Preview tem suas desvantagens: ele pode alterar inesperadamente o idioma de comunicação, ficar preso em certos pontos e lidar pior com tarefas quando o bom senso é necessário.

Um recurso interessante do QwQ-32B-Preview é a capacidade de “verificar a si mesmo”. Isto ajuda a evitar armadilhas comuns a outros sistemas de inteligência artificial, mas retarda o processo de encontrar soluções. Assim como os modelos o1 da OpenAI, o novo desenvolvimento do Alibaba resolve problemas em etapas, analisando e planejando gradualmente as próximas etapas.

Apesar do QwQ-32B-Preview estar disponível para download na plataforma Hugging Face sob a licença Apache 2.0 (software livre), que permite sua utilização para fins comerciais, o Alibaba divulgou apenas parte dos componentes do modelo, assim impedindo-nos de estudar o algoritmo dos mecanismos internos de funcionamento. Assim, apesar das afirmações sobre “abertura”, o modelo continua sendo uma opção intermediária entre sistemas fechados e abertos (licença de código aberto).

A origem chinesa do modelo também impõe certas restrições. Tal como outros desenvolvimentos da China, o QwQ-32B-Preview segue os requisitos de um regulador local, que testa a IA quanto à conformidade com “valores socialistas fundamentais”. A modelo se recusará a responder questões políticas relacionadas à China.

Vale dizer que o interesse em modelos de “raciocínio” está crescendo no contexto de uma diminuição na eficácia da abordagem tradicional para aumentar as capacidades da IA, baseada simplesmente no dimensionamento de dados e poder computacional. Empresas como OpenAI, Google e Anthropic estão cada vez mais a ver o seu progresso tecnológico lento, o que por sua vez está a encorajar os programadores a procurar novas abordagens, tais como “computação em tempo de teste”, que dão aos modelos tempo adicional para processar tarefas. Ao mesmo tempo, grandes laboratórios, incluindo o Google, estão investindo ativamente no desenvolvimento de tais tecnologias, o que confirma o seu papel fundamental no futuro da inteligência artificial.

avalanche

Postagens recentes

Intel lançou chipsets B860 e H810 para placas de baixo custo para Core Ultra 200

A Intel lançou oficialmente os chipsets B860 e H810, projetados para uso em placas-mãe relativamente…

4 horas atrás

A Asus apresentou a placa de overclocking ROG Crosshair X870E Apex – esta é a primeira placa Apex para Ryzen

A Asus apresentou a placa-mãe ROG Crosshair X870E Apex. Esta é a primeira placa-mãe desta…

5 horas atrás

Resultados de 2024: câmeras

O primeiro pensamento ao abordar o material final nas câmeras após uma pausa de dois…

5 horas atrás

AMD lançou chips móveis Ryzen AI 300 e o novo e antigo Ryzen 200 para laptops de baixo custo

Hoje, a AMD expandiu significativamente sua linha de processadores móveis, introduzindo duas novas séries que…

5 horas atrás