O modelo DarkBERT AI foi treinado na darknet, mas é destinado à ciência

Pesquisadores do Instituto de Ciência e Tecnologia da Coreia (KAIST) criaram o modelo DarkBERT AI para pesquisar “informações científicas valiosas” na dark web. A rede neural possui filtros especiais para isso, desenvolvidos para proteger os usuários de informações indesejadas.

Fonte da imagem: freepik

O DarkBERT é baseado na arquitetura RoBERTa desenvolvida em 2019. Ele experimentou uma espécie de renascimento e os pesquisadores descobriram que a arquitetura realmente oferece mais desempenho do que estava disponível anteriormente. Para treinar o modelo de IA, os pesquisadores examinaram a dark web por meio do firewall anônimo do Tor e filtraram os dados brutos usando desduplicação, balanceamento de categoria e pré-processamento de dados para criar o conjunto de dados necessário para o treinamento. O resultado do trabalho feito foi o DarkBERT, que consegue analisar pedaços de conteúdo da dark web e extrair dela informações úteis.

Uma das principais características dos modelos de linguagem grandes (LLMs) é a compreensão da linguagem. A dark web usa uma mistura muito específica de idiomas para comunicação empresarial, e o DarkBERT foi treinado nisso. O estudo descobriu que o DarkBERT supera outros grandes modelos de linguagem, o que deve permitir que pesquisadores de segurança e policiais se aprofundem na dark web.

Tal como acontece com outros LLMs, isso não significa que o trabalho no DarkBERT esteja concluído. Segundo os pesquisadores, eles pretendem continuar treinando e ajustando o modelo para melhorar seus resultados.

avalanche

Postagens recentes

As autoridades americanas estão se preparando para aumentar as tarifas de importação de chips, mas os clientes de hiperescala da TSMC receberão benefícios.

O governo do atual presidente dos EUA, Donald Trump, continua a reformar o comércio exterior…

2 horas atrás

O ex-produtor de GTA, Leslie Benzies, “deixou temporariamente a Build a Rocket Boy”, o estúdio que fundou, enquanto a direção da MindsEye espera seguir os passos de Cyberpunk 2077.

O ex-presidente da Rockstar North e ex-produtor de GTA, Leslie Benzies, deixou, pelo menos temporariamente,…

8 horas atrás

Calendário de lançamentos de 9 a 15 de fevereiro: Reanimal, Mewgenics, Romeo is a Dead Man e Disciples: Domination.

Meados de fevereiro traz uma semana agitada com grandes lançamentos e projetos indie empolgantes. Os…

9 horas atrás

O espetacular filme de ação retrofuturista Replaced encantou os jornalistas e em breve receberá uma demo no Steam.

Replaced, um jogo de plataforma de ação retrofuturista da Sad Cat Studios, uma equipe polonesa…

10 horas atrás

O Snapdragon X2 Elite foi mais rápido que o Apple M5 em testes sintéticos, mas perdeu para o Ryzen AI 9 e o Core Ultra X9 em jogos.

Espera-se que os laptops baseados nos processadores Snapdragon X2 de segunda geração da Qualcomm, com…

11 horas atrás