Um grupo de pesquisadores de universidades britânicas desenvolveu um algoritmo usando métodos de aprendizado profundo de redes neurais que é capaz de reconhecer dados com uma precisão de até 95% ao analisar o som das teclas do teclado sendo pressionados gravado por um microfone. No processo de treinamento do algoritmo de classificação de som, também foram utilizadas gravações de áudio feitas via Zoom, mas, neste caso, a precisão do reconhecimento caiu para 93%.

Fonte da imagem: Bleeping Computer

Um ataque acústico usando o algoritmo mencionado representa uma séria ameaça à segurança dos dados, pois essa abordagem pode ser usada para roubar senhas e outras informações confidenciais. Além disso, ao contrário de outros ataques de terceiros que exigem condições especiais, os ataques acústicos tornam-se mais fáceis de implementar à medida que os microfones proliferam, fornecendo captura de áudio de alta qualidade. Combinados com o rápido desenvolvimento de tecnologias de aprendizado de máquina, os ataques acústicos de canal lateral estão se tornando uma ferramenta mais perigosa nas mãos dos invasores do que se pensava anteriormente.

Para realizar esse ataque, os invasores precisam gravar o som das teclas pressionadas no teclado da vítima, pois esses dados são necessários para treinar o algoritmo de previsão. Isso pode ser feito usando um microfone próximo ou um smartphone infectado com malware que permite o acesso ao microfone do dispositivo. Você também pode gravar o som das teclas digitadas durante uma chamada de Zoom.

Fonte da imagem: Arxiv.org

O estudo atual coletou dados de treinamento representando a gravação de som de 36 teclas do MacBook Pro sendo pressionadas 25 vezes cada. Em seguida, foram obtidos oscilogramas e espectrogramas, que possibilitaram visualizar diferenças identificáveis ​​quando cada tecla era pressionada. Os pesquisadores também tomaram medidas para processar os dados em termos de amplificação do sinal para facilitar a identificação das chaves. Os espectrogramas foram usados ​​para treinar o classificador de imagem CoAtNet.

O experimento envolveu o mesmo laptop da Apple com teclado que vem sendo usado em todos os modelos de laptop da empresa nos últimos dois anos, além de um iPhone 13 mini localizado a uma distância de 17 cm do laptop e gravando som, e o Serviço de zoom, que também foi utilizado para gravar o som das teclas pressionadas. Como resultado, os pesquisadores conseguiram que o classificador CoAtNet alcançasse 95% de precisão ao processar gravações de um smartphone e 93% ao processar dados gravados via Zoom. Ao experimentar o Skype, a precisão caiu para 91,7%.

Fonte da imagem: Arxiv.org

Para usuários preocupados com ataques acústicos, os pesquisadores recomendam mudar o estilo de digitação, bem como usar senhas geradas aleatoriamente. Além disso, as ferramentas de software podem ser usadas para reproduzir sons de pressionamento de tecla, ruído branco ou filtros de áudio do teclado.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *