No 56º Simpósio Internacional Anual IEEE/ACM sobre Microarquitetura, pesquisadores da Universidade da Califórnia, Riverside (UCR) demonstraram uma abordagem que permitiria que qualquer componente de computação em uma plataforma fosse realmente executado simultaneamente. Com isso, você pode dobrar a velocidade dos cálculos e reduzir pela metade o consumo de energia. A tecnologia pode funcionar em qualquer processador e acelerador, desde smartphones até servidores de data center, mas requer desenvolvimento adicional.

Fonte da imagem: geração AI DALL-E/newatlas.com

«Você não precisa adicionar novos processadores [para acelerar a computação] porque já os possui”, disse Hung-Wei Tseng, professor associado do Departamento de Engenharia Elétrica e de Computação da Universidade da Califórnia e coautor do estudar. Você só precisa gerenciar com sabedoria os recursos de hardware disponíveis e não alinhá-los todos.

A plataforma desenvolvida pelos pesquisadores, chamada de multithreading simultâneo e heterogêneo (SHMT), rompe com os modelos de programação tradicionais. Em vez de fornecer dados em um período de tempo para apenas um dos componentes de computação do sistema – central, gráfico, tensor ou outro processador ou acelerador, a tecnologia SHMT paraleliza a execução de código em todos os componentes simultaneamente.

Plataforma de teste. Fonte da imagem: Hsu e Tseng

SHMT usa uma política de agendamento multithreading de roubo de trabalho com reconhecimento de qualidade (QAWS) que é leve, mas ajuda a manter o controle de qualidade e o equilíbrio da carga de trabalho. O sistema de tempo de execução cria e divide um conjunto de operações virtuais (vOPS) em uma ou mais operações de alto nível (HLOPs) para utilizar vários recursos de hardware simultaneamente. O sistema de tempo de execução SHMT distribui esses HLOPS para filas de tarefas para execução no hardware de destino. Como os HLOPS são independentes de hardware, o sistema de tempo de execução pode redirecionar tarefas conforme necessário para um ou outro componente da plataforma de computação.

Comparação de métodos de paralelização de métodos convencionais, heterogêneos modernos e SHMT

O que é especialmente valioso é que os pesquisadores, usando o exemplo da plataforma de teste que criaram, mostraram a eficácia das novas bibliotecas de software. Eles criaram uma espécie de híbrido que pode ser considerado tanto um smartphone quanto uma espécie de PC e até mesmo um servidor. Baseado em uma placa backplane com conector PCIe, um “computador” foi criado a partir da combinação de um módulo NVIDIA Nano Jetson com um processador (CPU) ARM Cortex-A57 quad-core e 128 núcleos gráficos (GPU) da arquitetura Maxwell. O acelerador Google Edge (TPU) foi conectado através do slot M.2 Key E na placa.

Aceleração dos cálculos SHMT dependendo da política selecionada

A memória principal do sistema apresentado é LPDDR4 de 4 GB com frequência de 1600 MHz e velocidade de 25,6 Gbps, onde são armazenados os dados gerais. O módulo Edge TPU contém adicionalmente 8 MB de memória e Ubuntu Linux 18.04 foi usado como sistema operacional.

Comparação do consumo ativo e ocioso entre computação convencional e SHMT

A execução do pacote SHMT em uma plataforma heterogênea improvisada usando aplicativos de teste padrão mostrou que, com a política mais eficiente, a estrutura QAWS mostra um aumento de 1,95 vezes na velocidade de computação e uma redução significativa no consumo de 51% em comparação com o método básico de distribuição de computação. Se você dimensionar essa abordagem para uso como parte de um data center, os ganhos prometem ser enormes e, ao mesmo tempo, todo o hardware permanecerá o mesmo – nada precisará ser alterado. A solução proposta ainda não está pronta para implementação, mas certamente encontrará facilmente interessados ​​nela.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *