Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

Alibaba introduziu um modelo de IA aberto que é melhor que OpenAI

A empresa chinesa Alibaba introduziu um modelo de inteligência artificial de código aberto chamado QwQ-32B-Preview. O modelo é capaz de resolver problemas lógicos e matemáticos complexos, contém 32,5 bilhões de parâmetros e pode processar consultas de até 32 mil palavras. De acordo com testes realizados pelo Alibaba, o QwQ-32B-Preview supera os modelos o1-preview e o1-mini da OpenAI em diversas áreas.

Fonte da imagem: Copiloto

Uma das principais vantagens do QwQ-32B-Preview, conforme relatado pelo TechCrunch, é o seu desempenho nos testes AIME e MATH. O teste AIME avalia o desempenho do modelo em relação a outras inteligências artificiais, e o teste MATH é um conjunto de problemas matemáticos baseados em palavras. Graças às suas características, este bot de IA é capaz de resolver problemas complexos e quebra-cabeças lógicos. No entanto, observa-se que o QwQ-32B-Preview tem suas desvantagens: ele pode alterar inesperadamente o idioma de comunicação, ficar preso em certos pontos e lidar pior com tarefas quando o bom senso é necessário.

Um recurso interessante do QwQ-32B-Preview é a capacidade de “verificar a si mesmo”. Isto ajuda a evitar armadilhas comuns a outros sistemas de inteligência artificial, mas retarda o processo de encontrar soluções. Assim como os modelos o1 da OpenAI, o novo desenvolvimento do Alibaba resolve problemas em etapas, analisando e planejando gradualmente as próximas etapas.

Apesar do QwQ-32B-Preview estar disponível para download na plataforma Hugging Face sob a licença Apache 2.0 (software livre), que permite sua utilização para fins comerciais, o Alibaba divulgou apenas parte dos componentes do modelo, assim impedindo-nos de estudar o algoritmo dos mecanismos internos de funcionamento. Assim, apesar das afirmações sobre “abertura”, o modelo continua sendo uma opção intermediária entre sistemas fechados e abertos (licença de código aberto).

A origem chinesa do modelo também impõe certas restrições. Tal como outros desenvolvimentos da China, o QwQ-32B-Preview segue os requisitos de um regulador local, que testa a IA quanto à conformidade com “valores socialistas fundamentais”. A modelo se recusará a responder questões políticas relacionadas à China.

Vale dizer que o interesse em modelos de “raciocínio” está crescendo no contexto de uma diminuição na eficácia da abordagem tradicional para aumentar as capacidades da IA, baseada simplesmente no dimensionamento de dados e poder computacional. Empresas como OpenAI, Google e Anthropic estão cada vez mais a ver o seu progresso tecnológico lento, o que por sua vez está a encorajar os programadores a procurar novas abordagens, tais como “computação em tempo de teste”, que dão aos modelos tempo adicional para processar tarefas. Ao mesmo tempo, grandes laboratórios, incluindo o Google, estão investindo ativamente no desenvolvimento de tais tecnologias, o que confirma o seu papel fundamental no futuro da inteligência artificial.

avalanche

Próximo Modo foto, jogo cruzado e 12 novas subclasses: Larian anunciou o oitavo grande patch para Baldur’s Gate 3 »

Anterior « As autoridades dos EUA privaram a Intel da oportunidade de vender sua produção de chips

Deixar comentário

Publicado por

avalanche

1 ano atrás

Postagens recentes

Eventos e eventos da indústria de TI, exposições, fóruns

NVIDIA Groq 3: SRAM, desagregação, determinismo

As LPUs da Groq são fundamentalmente diferentes dos aceleradores de IA da NVIDIA, mas são…

50 minutos atrás

Manipuladores, dispositivos gráficos de entrada

A Razer apresentou o mouse sem fio Viper V4 Pro — 49 gramas, 50.000 DPI, switches ópticos e 180 horas de duração da bateria por US$ 160.

A Razer apresentou o mouse gamer sem fio Viper V4 Pro. O novo mouse conta…

2 horas atrás

Na vanguarda da ciência

A primeira cerveja do mundo feita com CO₂ extraído diretamente do ar ambiente foi lançada nos EUA.

Pela primeira vez no mundo, a cerveja foi carbonatada com dióxido de carbono (CO₂) capturado…

2 horas atrás

Eventos e eventos da indústria de TI, exposições, fóruns

O CEO da Intel, Lip-Bu Tan, fará um discurso na Computex 2026 em junho, mas não são esperados grandes anúncios.

A Intel confirmou que o CEO Lip-Bu Tan fará o discurso de abertura na Computex…

2 horas atrás

Jogos

A Sony fechará o novo estúdio de direção de Call of Duty: Black Ops 3 um ano após sua inauguração.

Apenas um mês se passou desde o chocante fechamento da Bluepoint Games (responsável pelos remakes…

2 horas atrás

IOS Apps

A Apple confirmou a exibição de anúncios no app Mapas e prometeu não rastrear os movimentos dos usuários.

A Apple confirmou a futura inclusão de anúncios no aplicativo Mapas. As mudanças entrarão em…

2 horas atrás

Alibaba introduziu um modelo de IA aberto que é melhor que OpenAI

Conteúdo relacionado

Postagens recentes

NVIDIA Groq 3: SRAM, desagregação, determinismo

A Razer apresentou o mouse sem fio Viper V4 Pro — 49 gramas, 50.000 DPI, switches ópticos e 180 horas de duração da bateria por US$ 160.

A primeira cerveja do mundo feita com CO₂ extraído diretamente do ar ambiente foi lançada nos EUA.

O CEO da Intel, Lip-Bu Tan, fará um discurso na Computex 2026 em junho, mas não são esperados grandes anúncios.

A Sony fechará o novo estúdio de direção de Call of Duty: Black Ops 3 um ano após sua inauguração.

A Apple confirmou a exibição de anúncios no app Mapas e prometeu não rastrear os movimentos dos usuários.