O modelo DarkBERT AI foi treinado na darknet, mas é destinado à ciência

Pesquisadores do Instituto de Ciência e Tecnologia da Coreia (KAIST) criaram o modelo DarkBERT AI para pesquisar “informações científicas valiosas” na dark web. A rede neural possui filtros especiais para isso, desenvolvidos para proteger os usuários de informações indesejadas.

Fonte da imagem: freepik

O DarkBERT é baseado na arquitetura RoBERTa desenvolvida em 2019. Ele experimentou uma espécie de renascimento e os pesquisadores descobriram que a arquitetura realmente oferece mais desempenho do que estava disponível anteriormente. Para treinar o modelo de IA, os pesquisadores examinaram a dark web por meio do firewall anônimo do Tor e filtraram os dados brutos usando desduplicação, balanceamento de categoria e pré-processamento de dados para criar o conjunto de dados necessário para o treinamento. O resultado do trabalho feito foi o DarkBERT, que consegue analisar pedaços de conteúdo da dark web e extrair dela informações úteis.

Uma das principais características dos modelos de linguagem grandes (LLMs) é a compreensão da linguagem. A dark web usa uma mistura muito específica de idiomas para comunicação empresarial, e o DarkBERT foi treinado nisso. O estudo descobriu que o DarkBERT supera outros grandes modelos de linguagem, o que deve permitir que pesquisadores de segurança e policiais se aprofundem na dark web.

Tal como acontece com outros LLMs, isso não significa que o trabalho no DarkBERT esteja concluído. Segundo os pesquisadores, eles pretendem continuar treinando e ajustando o modelo para melhorar seus resultados.

avalanche

Postagens recentes

A OpenAI apresentou o GPT-5.6 Sol, Terra e Luna, mas apenas alguns selecionados tiveram acesso aos novos modelos.

A OpenAI apresentou oficialmente sua família de modelos de linguagem GPT-5.6, que inclui três modelos…

1 hora atrás

Um criador de mods ensinou o controle do Steam a retornar automaticamente para a base de carregamento.

Um entusiasta criou uma ferramenta online que guia o novo controle Steam da Valve de…

2 horas atrás

Fãs de Resident Evil 2 identificaram o misterioso namorado de Jill Valentine após 28 anos de buscas.

Após 28 anos de buscas, os fãs do clássico jogo de terror e sobrevivência Resident…

3 horas atrás

A “multidão sem rosto” proibiu permanentemente o fundador da Wikipédia de editá-la.

A Wikipédia pode ser editada por qualquer um de seus 53 milhões de membros, mas…

4 horas atrás

‘Modelo de negócio insustentável’: Volkswagen prepara-se para demitir até 100 mil trabalhadores e fechar quatro fábricas.

Segundo fontes familiarizadas com o assunto, a Volkswagen está considerando fechar quatro fábricas na Alemanha…

4 horas atrás