Um modelo baseado em regras para a detecção de bots no Twitter
Date
2019
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
UFVJM
Abstract
O grande crescimento do uso cotidiano das redes sociais on-line pela sociedade transformou-as
em importantes fontes de estudos em diversas áreas. Os dados gerados por essas redes
passaram a ser utilizados em pesquisas de diferentes fins, que vão desde a previsão do mercado
de ações e resultados de eleições, até o comportamento humano. Porém, as amostras de dados
extraídas dessas redes tornaram-se vulneráveis às atividades dos bots, contas automatizadas
utilizadas com o objetivo de enganar e influenciar outros usuários. Diante disso, este trabalho
propôs uma abordagem supervisionada de extração de conhecimento de uma base de dados da
literatura, por meio de técnicas que visam não somente classificar, mas descrever as principais
características dos bots no Twitter, gerando assim um modelo de classificação baseado em
regras. Após a interpretação e modelagem do problema, os dados foram preparados, inserindo,
modificando, preenchendo e excluindo atributos por meio de informações de contexto para as
diferentes técnicas de Inteligência Artificial aplicadas. A Árvore de Decisão construiu condições
sequenciais em linguagem natural, demonstrando um poder de classificação de 0,97 para a
AUC-ROC. Novas regras foram geradas,por meio de indução, baseada em escores, a fim de
encontrar condicões que foram negligenciadas pela árvore. Essas regras foram avaliadas pela
métricas de Cobertura, Confiança e Lift, e demonstraram um alto poder discriminante. Este
trabalho visa contribuir com a camada de filtro de bots no Framework Oráculo, que, por meio
de uma interface amigável, visa coletar dados do Twitter com pouca interferência de contas
maliciosas. Esse framework está sendo construído pelo Grupo de Pesquisa MTPLNAM e será
disponibilizado para toda a comunidade sob licença de software livre.
Description
Keywords
Citation
LEITE, Maria Alice Gomes Lopes. Um modelo baseado em regras para a detecção de bots no Twitter. 2019. 74 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2019.