A empresa chinesa Alibaba introduziu um modelo de inteligência artificial de código aberto chamado QwQ-32B-Preview. O modelo é capaz de resolver problemas lógicos e matemáticos complexos, contém 32,5 bilhões de parâmetros e pode processar consultas de até 32 mil palavras. De acordo com testes realizados pelo Alibaba, o QwQ-32B-Preview supera os modelos o1-preview e o1-mini da OpenAI em diversas áreas.

Fonte da imagem: Copiloto

Uma das principais vantagens do QwQ-32B-Preview, conforme relatado pelo TechCrunch, é o seu desempenho nos testes AIME e MATH. O teste AIME avalia o desempenho do modelo em relação a outras inteligências artificiais, e o teste MATH é um conjunto de problemas matemáticos baseados em palavras. Graças às suas características, este bot de IA é capaz de resolver problemas complexos e quebra-cabeças lógicos. No entanto, observa-se que o QwQ-32B-Preview tem suas desvantagens: ele pode alterar inesperadamente o idioma de comunicação, ficar preso em certos pontos e lidar pior com tarefas quando o bom senso é necessário.

Um recurso interessante do QwQ-32B-Preview é a capacidade de “verificar a si mesmo”. Isto ajuda a evitar armadilhas comuns a outros sistemas de inteligência artificial, mas retarda o processo de encontrar soluções. Assim como os modelos o1 da OpenAI, o novo desenvolvimento do Alibaba resolve problemas em etapas, analisando e planejando gradualmente as próximas etapas.

Apesar do QwQ-32B-Preview estar disponível para download na plataforma Hugging Face sob a licença Apache 2.0 (software livre), que permite sua utilização para fins comerciais, o Alibaba divulgou apenas parte dos componentes do modelo, assim impedindo-nos de estudar o algoritmo dos mecanismos internos de funcionamento. Assim, apesar das afirmações sobre “abertura”, o modelo continua sendo uma opção intermediária entre sistemas fechados e abertos (licença de código aberto).

A origem chinesa do modelo também impõe certas restrições. Tal como outros desenvolvimentos da China, o QwQ-32B-Preview segue os requisitos de um regulador local, que testa a IA quanto à conformidade com “valores socialistas fundamentais”. A modelo se recusará a responder questões políticas relacionadas à China.

Vale dizer que o interesse em modelos de “raciocínio” está crescendo no contexto de uma diminuição na eficácia da abordagem tradicional para aumentar as capacidades da IA, baseada simplesmente no dimensionamento de dados e poder computacional. Empresas como OpenAI, Google e Anthropic estão cada vez mais a ver o seu progresso tecnológico lento, o que por sua vez está a encorajar os programadores a procurar novas abordagens, tais como “computação em tempo de teste”, que dão aos modelos tempo adicional para processar tarefas. Ao mesmo tempo, grandes laboratórios, incluindo o Google, estão investindo ativamente no desenvolvimento de tais tecnologias, o que confirma o seu papel fundamental no futuro da inteligência artificial.

avalanche

Postagens recentes

“Agonizantemente baixo”: Elon Musk prevê um início difícil para o Cybercab e o Optimus.

A tradição da Tesla de revelar algo importante para seus negócios no ano seguinte levou…

18 minutos atrás

O Spotify está se preparando para sincronizar o progresso entre audiolivros e livros impressos – em ambas as direções.

Em diversos países, o serviço de streaming Spotify oferece acesso a audiolivros, e na versão…

51 minutos atrás

As placas gráficas Nvidia GeForce RTX 5090 estão praticamente esgotadas nos EUA.

As placas gráficas GeForce RTX 5090, carro-chefe da Nvidia, lançadas há um ano, foram vendidas…

2 horas atrás

O CEO do Google DeepMind estima que os modelos de IA chineses estejam seis meses atrasados.

O CEO da DeepMind, Demis Hassabis, afirmou na semana passada que a diferença entre os…

3 horas atrás

A Microsoft acredita que a formação de uma bolha só pode ser evitada com a implementação generalizada da IA.

Os especialistas mais alarmistas afirmam repetidamente que o ritmo acelerado do desenvolvimento da IA ​​no…

3 horas atrás