A empresa chinesa Alibaba introduziu um modelo de inteligência artificial de código aberto chamado QwQ-32B-Preview. O modelo é capaz de resolver problemas lógicos e matemáticos complexos, contém 32,5 bilhões de parâmetros e pode processar consultas de até 32 mil palavras. De acordo com testes realizados pelo Alibaba, o QwQ-32B-Preview supera os modelos o1-preview e o1-mini da OpenAI em diversas áreas.

Fonte da imagem: Copiloto

Uma das principais vantagens do QwQ-32B-Preview, conforme relatado pelo TechCrunch, é o seu desempenho nos testes AIME e MATH. O teste AIME avalia o desempenho do modelo em relação a outras inteligências artificiais, e o teste MATH é um conjunto de problemas matemáticos baseados em palavras. Graças às suas características, este bot de IA é capaz de resolver problemas complexos e quebra-cabeças lógicos. No entanto, observa-se que o QwQ-32B-Preview tem suas desvantagens: ele pode alterar inesperadamente o idioma de comunicação, ficar preso em certos pontos e lidar pior com tarefas quando o bom senso é necessário.

Um recurso interessante do QwQ-32B-Preview é a capacidade de “verificar a si mesmo”. Isto ajuda a evitar armadilhas comuns a outros sistemas de inteligência artificial, mas retarda o processo de encontrar soluções. Assim como os modelos o1 da OpenAI, o novo desenvolvimento do Alibaba resolve problemas em etapas, analisando e planejando gradualmente as próximas etapas.

Apesar do QwQ-32B-Preview estar disponível para download na plataforma Hugging Face sob a licença Apache 2.0 (software livre), que permite sua utilização para fins comerciais, o Alibaba divulgou apenas parte dos componentes do modelo, assim impedindo-nos de estudar o algoritmo dos mecanismos internos de funcionamento. Assim, apesar das afirmações sobre “abertura”, o modelo continua sendo uma opção intermediária entre sistemas fechados e abertos (licença de código aberto).

A origem chinesa do modelo também impõe certas restrições. Tal como outros desenvolvimentos da China, o QwQ-32B-Preview segue os requisitos de um regulador local, que testa a IA quanto à conformidade com “valores socialistas fundamentais”. A modelo se recusará a responder questões políticas relacionadas à China.

Vale dizer que o interesse em modelos de “raciocínio” está crescendo no contexto de uma diminuição na eficácia da abordagem tradicional para aumentar as capacidades da IA, baseada simplesmente no dimensionamento de dados e poder computacional. Empresas como OpenAI, Google e Anthropic estão cada vez mais a ver o seu progresso tecnológico lento, o que por sua vez está a encorajar os programadores a procurar novas abordagens, tais como “computação em tempo de teste”, que dão aos modelos tempo adicional para processar tarefas. Ao mesmo tempo, grandes laboratórios, incluindo o Google, estão investindo ativamente no desenvolvimento de tais tecnologias, o que confirma o seu papel fundamental no futuro da inteligência artificial.

avalanche

Postagens recentes

Microsoft foi alvo de investigação antitruste total nos EUA

A Comissão Federal de Comércio dos EUA (FTC) lançou uma investigação antitruste sobre a Microsoft,…

30 minutos atrás

Resultados do Devolver Delayed Awards 2024 – Baby Steps, Stick it to the Stickman e Skate Story não serão lançados em 2024

Após o teaser recente, a editora Devolver Digital sediou o Devolver Delayed Awards 2024, que…

50 minutos atrás

A Microsoft desenvolveu uma loja Xbox para Android, mas não consegue lançá-la por causa do Google

Em outubro, a presidente do Xbox, Sarah Bond, prometeu que até o final de novembro…

1 hora atrás

Os EUA prepararam novas sanções anti-chinesas que atingirão Micron, Samsung e SK Hynix

A atual administração do presidente dos EUA, Joseph Biden, tem cerca de dois meses de…

2 horas atrás

Modo foto, jogo cruzado e 12 novas subclasses: Larian anunciou o oitavo grande patch para Baldur’s Gate 3

Como esperado, o sétimo patch não será o último para Baldur’s Gate 3. Os desenvolvedores…

2 horas atrás