O modelo DarkBERT AI foi treinado na darknet, mas é destinado à ciência

Pesquisadores do Instituto de Ciência e Tecnologia da Coreia (KAIST) criaram o modelo DarkBERT AI para pesquisar “informações científicas valiosas” na dark web. A rede neural possui filtros especiais para isso, desenvolvidos para proteger os usuários de informações indesejadas.

Fonte da imagem: freepik

O DarkBERT é baseado na arquitetura RoBERTa desenvolvida em 2019. Ele experimentou uma espécie de renascimento e os pesquisadores descobriram que a arquitetura realmente oferece mais desempenho do que estava disponível anteriormente. Para treinar o modelo de IA, os pesquisadores examinaram a dark web por meio do firewall anônimo do Tor e filtraram os dados brutos usando desduplicação, balanceamento de categoria e pré-processamento de dados para criar o conjunto de dados necessário para o treinamento. O resultado do trabalho feito foi o DarkBERT, que consegue analisar pedaços de conteúdo da dark web e extrair dela informações úteis.

Uma das principais características dos modelos de linguagem grandes (LLMs) é a compreensão da linguagem. A dark web usa uma mistura muito específica de idiomas para comunicação empresarial, e o DarkBERT foi treinado nisso. O estudo descobriu que o DarkBERT supera outros grandes modelos de linguagem, o que deve permitir que pesquisadores de segurança e policiais se aprofundem na dark web.

Tal como acontece com outros LLMs, isso não significa que o trabalho no DarkBERT esteja concluído. Segundo os pesquisadores, eles pretendem continuar treinando e ajustando o modelo para melhorar seus resultados.

avalanche

Postagens recentes

As ações da Intel dispararam quase um quarto, arrastando consigo as de seus concorrentes — a Nvidia agora vale US$ 5 trilhões.

A reação inicial do mercado de ações à divulgação dos resultados trimestrais no final desta…

19 minutos atrás

A rede social X lançou o aplicativo de mensagens XChat para iOS e abandonou o conceito de Elon Musk de um único “superaplicativo”.

A rede social X, de Elon Musk, lançou um aplicativo de mensagens independente, o XChat,…

1 hora atrás

Elon Musk anunciou mais uma vez o lançamento do Tesla Cybercab, um táxi autônomo.

O primeiro táxi autônomo da Tesla, o Cybercab, saiu da linha de montagem em fevereiro…

1 hora atrás

O BMW iX3 Flow Edition apresenta um capô que muda de cor utilizando tecnologia de tinta eletrônica.

A BMW vem cultivando a ideia de criar um revestimento para a carroceria que muda…

1 hora atrás

O Rei Está Nu: VDURA Confiante de que os SSDs não Substituirão os HDDs nos Data Centers

Segundo Ken Claffey, CEO da VDURA, o aumento dos preços e a escassez de memória…

8 horas atrás

Mouse: Detetive Particular para Contratar – Uma Perdição em Preto e Branco com Ratos. Análise / Jogos

Processador Intel Core i5-9500 de 3,0 GHz / AMD Ryzen 5 3400G de 3,7 GHz,…

8 horas atrás