Um modelo baseado em regras para a detecção de bots no Twitter

Thumbnail Image

Date

2019

Journal Title

Journal ISSN

Volume Title

Publisher

UFVJM

Abstract

O grande crescimento do uso cotidiano das redes sociais on-line pela sociedade transformou-as em importantes fontes de estudos em diversas áreas. Os dados gerados por essas redes passaram a ser utilizados em pesquisas de diferentes fins, que vão desde a previsão do mercado de ações e resultados de eleições, até o comportamento humano. Porém, as amostras de dados extraídas dessas redes tornaram-se vulneráveis às atividades dos bots, contas automatizadas utilizadas com o objetivo de enganar e influenciar outros usuários. Diante disso, este trabalho propôs uma abordagem supervisionada de extração de conhecimento de uma base de dados da literatura, por meio de técnicas que visam não somente classificar, mas descrever as principais características dos bots no Twitter, gerando assim um modelo de classificação baseado em regras. Após a interpretação e modelagem do problema, os dados foram preparados, inserindo, modificando, preenchendo e excluindo atributos por meio de informações de contexto para as diferentes técnicas de Inteligência Artificial aplicadas. A Árvore de Decisão construiu condições sequenciais em linguagem natural, demonstrando um poder de classificação de 0,97 para a AUC-ROC. Novas regras foram geradas,por meio de indução, baseada em escores, a fim de encontrar condicões que foram negligenciadas pela árvore. Essas regras foram avaliadas pela métricas de Cobertura, Confiança e Lift, e demonstraram um alto poder discriminante. Este trabalho visa contribuir com a camada de filtro de bots no Framework Oráculo, que, por meio de uma interface amigável, visa coletar dados do Twitter com pouca interferência de contas maliciosas. Esse framework está sendo construído pelo Grupo de Pesquisa MTPLNAM e será disponibilizado para toda a comunidade sob licença de software livre.

Description

Keywords

Citation

LEITE, Maria Alice Gomes Lopes. Um modelo baseado em regras para a detecção de bots no Twitter. 2019. 74 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2019.

Endorsement

Review

Supplemented By

Referenced By