Uma descrição detalhada da atualização mais recente dos filtros de spam do serviço de e-mail do Gmail apareceu no blog do desenvolvedor do Google. A empresa chamou isso de “uma das maiores atualizações de segurança dos últimos anos”.

Fonte da imagem: dieryreyes3456 / Pixabay

Estamos a falar da integração no serviço postal do novo sistema de classificação de texto Resilient & Vetorizador de texto eficiente (RETVec). Segundo os desenvolvedores, ele identifica com eficácia mensagens de spam, incluindo e-mails com um grande número de caracteres especiais, emoticons, erros de digitação e outros elementos que antes eram distinguíveis pelos humanos, mas difíceis de detectar pelos filtros de spam. De acordo com os dados disponíveis, o novo algoritmo identifica eficazmente, entre outras coisas, mensagens com homóglifos, ou seja, sinais graficamente muito semelhantes entre si, com significados diferentes.

Segundo o Google, o algoritmo RETVec é treinado para identificar com eficácia mensagens que contenham um teste que foi manipulado de alguma forma, incluindo inserção ou exclusão de caracteres, erros de digitação, homóglifos, etc. quaisquer caracteres e palavras no formato UTF-8. Como resultado, os desenvolvedores receberam um algoritmo que funciona imediatamente em mais de 100 idiomas em todo o mundo.

Exemplo de e-mail de spam com homóglifos / Fonte da imagem: Ron Amadeo / arstechnica.com

Aparentemente, o RETVec funciona da mesma maneira que as pessoas leem. O algoritmo é construído na estrutura TensorFlow AI e em seu processo determina a “semelhança” visual para determinar o significado das palavras, em vez dos caracteres que realmente as compõem. De acordo com o Google, a substituição do vetorizador de texto do Gmail usado anteriormente pelo RETVec aumentou o nível de detecção de spam em 38% em comparação com a linha de base, e o número de falsos positivos diminuiu 19,4%. Ao mesmo tempo, o número de unidades de processamento tensor (TPUs) utilizadas pelo modelo diminuiu 83%, o que torna a atualização atual uma das maiores para o sistema de segurança do Gmail nos últimos anos.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *