Cientistas chineses se tornaram os primeiros no mundo a usar um computador quântico para ajustar uma inteligência artificial – um grande modelo de linguagem com um bilhão de parâmetros. Isso marcou o primeiro uso prático de uma plataforma quântica. É aqui que o computador Wukong da empresa chinesa Origin, baseado em 72 qubits supercondutores, brilha.

Fonte da imagem: Origem

O sistema Wukong faz parte da terceira geração de computadores quânticos da Origin. Em janeiro de 2024, o acesso à nuvem foi aberto em todo o mundo. Como os desenvolvedores admitem, o fluxo de cientistas foi liderado por pesquisadores dos Estados Unidos, apesar do fato de os cientistas chineses ainda não terem acesso a recursos semelhantes de seus parceiros ocidentais.

«Esta é a primeira vez que um computador quântico real foi usado para ajustar um grande modelo de linguagem em um ambiente prático. Isso demonstra que o hardware quântico moderno pode começar a dar suporte a tarefas de treinamento de IA no mundo real”, disse Chen Zhaoyun, pesquisador do Instituto de Inteligência Artificial do Centro Nacional de Ciências em Hefei.

De acordo com os cientistas, o sistema da Origin Wukong melhorou os resultados do treinamento de IA em 8,4%, reduzindo o número de parâmetros em 76%. Normalmente, supercomputadores são usados ​​para resolver esses problemas — especializações de IA de propósito geral — que exigem recursos significativos de computação e energia. Um computador quântico que usa o princípio da superposição quântica — um conjunto de estados probabilísticos em vez de dois clássicos (0 e 1) — é capaz de acelerar exponencialmente cálculos com um gasto de recursos relativamente modesto.

Em particular, os cientistas demonstraram os benefícios do ajuste fino de um grande modelo de linguagem usando um sistema quântico para diagnosticar transtornos mentais (as taxas de erro foram reduzidas em 15%), bem como para resolver problemas matemáticos, onde a precisão aumentou de 68% para 82%.

Para executar algoritmos de aprendizado de IA em uma plataforma quântica, os pesquisadores desenvolveram o que chamaram de “ajuste de parâmetros híbridos de tensor ponderado quântico”. Os valores de peso foram processados ​​pela plataforma quântica, enquanto a parte clássica preparou um grande modelo de linguagem. Graças à superposição e ao efeito de emaranhamento quântico, a plataforma Origin Wukong foi capaz de processar simultaneamente um grande número de combinações de parâmetros, o que acelerou a especialização do modelo.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *