A empresa chinesa Alibaba introduziu um modelo de inteligência artificial de código aberto chamado QwQ-32B-Preview. O modelo é capaz de resolver problemas lógicos e matemáticos complexos, contém 32,5 bilhões de parâmetros e pode processar consultas de até 32 mil palavras. De acordo com testes realizados pelo Alibaba, o QwQ-32B-Preview supera os modelos o1-preview e o1-mini da OpenAI em diversas áreas.

Fonte da imagem: Copiloto

Uma das principais vantagens do QwQ-32B-Preview, conforme relatado pelo TechCrunch, é o seu desempenho nos testes AIME e MATH. O teste AIME avalia o desempenho do modelo em relação a outras inteligências artificiais, e o teste MATH é um conjunto de problemas matemáticos baseados em palavras. Graças às suas características, este bot de IA é capaz de resolver problemas complexos e quebra-cabeças lógicos. No entanto, observa-se que o QwQ-32B-Preview tem suas desvantagens: ele pode alterar inesperadamente o idioma de comunicação, ficar preso em certos pontos e lidar pior com tarefas quando o bom senso é necessário.

Um recurso interessante do QwQ-32B-Preview é a capacidade de “verificar a si mesmo”. Isto ajuda a evitar armadilhas comuns a outros sistemas de inteligência artificial, mas retarda o processo de encontrar soluções. Assim como os modelos o1 da OpenAI, o novo desenvolvimento do Alibaba resolve problemas em etapas, analisando e planejando gradualmente as próximas etapas.

Apesar do QwQ-32B-Preview estar disponível para download na plataforma Hugging Face sob a licença Apache 2.0 (software livre), que permite sua utilização para fins comerciais, o Alibaba divulgou apenas parte dos componentes do modelo, assim impedindo-nos de estudar o algoritmo dos mecanismos internos de funcionamento. Assim, apesar das afirmações sobre “abertura”, o modelo continua sendo uma opção intermediária entre sistemas fechados e abertos (licença de código aberto).

A origem chinesa do modelo também impõe certas restrições. Tal como outros desenvolvimentos da China, o QwQ-32B-Preview segue os requisitos de um regulador local, que testa a IA quanto à conformidade com “valores socialistas fundamentais”. A modelo se recusará a responder questões políticas relacionadas à China.

Vale dizer que o interesse em modelos de “raciocínio” está crescendo no contexto de uma diminuição na eficácia da abordagem tradicional para aumentar as capacidades da IA, baseada simplesmente no dimensionamento de dados e poder computacional. Empresas como OpenAI, Google e Anthropic estão cada vez mais a ver o seu progresso tecnológico lento, o que por sua vez está a encorajar os programadores a procurar novas abordagens, tais como “computação em tempo de teste”, que dão aos modelos tempo adicional para processar tarefas. Ao mesmo tempo, grandes laboratórios, incluindo o Google, estão investindo ativamente no desenvolvimento de tais tecnologias, o que confirma o seu papel fundamental no futuro da inteligência artificial.

avalanche

Postagens recentes

Um desenvolvedor da tecnologia de pontos quânticos para TVs revelou as deficiências dos painéis de LED RGB.

No evento anual Display Week, em Los Angeles, a Nanosys, desenvolvedora da tecnologia "superquantum dot"…

2 horas atrás

A Microsoft aprimorou a experiência do touchpad e do teclado virtual no Windows 11, além de aumentar a estabilidade do Explorador de Arquivos.

Esta semana, a Microsoft lançou quatro versões beta do Windows 11 para o programa Windows…

3 horas atrás

Os Estados Unidos estão investigando acidentes envolvendo os robôs-táxi da Avride, empresa que antes fazia parte da Yandex.

A Administração Nacional de Segurança Rodoviária dos Estados Unidos (NHTSA) abriu uma investigação sobre a…

3 horas atrás

Os usuários do Instagram foram privados da criptografia de ponta a ponta em mensagens privadas.

Em 8 de maio, o Instagram descontinuou a criptografia de ponta a ponta para mensagens…

3 horas atrás

Um grupo de aplicativos fraudulentos do CallPhantom surgiu na Play Store, com 7,3 milhões de downloads.

A Google Play Store é considerada uma plataforma relativamente segura para baixar aplicativos Android, mas…

3 horas atrás