Um modelo baseado em regras para a detecção de bots no Twitter

dc.contributor.advisorGuelpeli, Marcus Vinícius Carvalho
dc.contributor.advisorcoSantos, Caroline Queiroz
dc.contributor.authorLeite, Maria Alice Gomes Lopes
dc.contributor.institutionUniversidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)pt_BR
dc.contributor.refereeSantos, Caroline Queiroz
dc.contributor.refereeVillela, Maria Lúcia Bento
dc.contributor.refereeMaia, Renato Dourado
dc.date.accessioned2022-02-01T14:29:40Z
dc.date.available2022-02-01T14:29:40Z
dc.date.issued2019
dc.date.submitted2019-12-12
dc.description.abstractO grande crescimento do uso cotidiano das redes sociais on-line pela sociedade transformou-as em importantes fontes de estudos em diversas áreas. Os dados gerados por essas redes passaram a ser utilizados em pesquisas de diferentes fins, que vão desde a previsão do mercado de ações e resultados de eleições, até o comportamento humano. Porém, as amostras de dados extraídas dessas redes tornaram-se vulneráveis às atividades dos bots, contas automatizadas utilizadas com o objetivo de enganar e influenciar outros usuários. Diante disso, este trabalho propôs uma abordagem supervisionada de extração de conhecimento de uma base de dados da literatura, por meio de técnicas que visam não somente classificar, mas descrever as principais características dos bots no Twitter, gerando assim um modelo de classificação baseado em regras. Após a interpretação e modelagem do problema, os dados foram preparados, inserindo, modificando, preenchendo e excluindo atributos por meio de informações de contexto para as diferentes técnicas de Inteligência Artificial aplicadas. A Árvore de Decisão construiu condições sequenciais em linguagem natural, demonstrando um poder de classificação de 0,97 para a AUC-ROC. Novas regras foram geradas,por meio de indução, baseada em escores, a fim de encontrar condicões que foram negligenciadas pela árvore. Essas regras foram avaliadas pela métricas de Cobertura, Confiança e Lift, e demonstraram um alto poder discriminante. Este trabalho visa contribuir com a camada de filtro de bots no Framework Oráculo, que, por meio de uma interface amigável, visa coletar dados do Twitter com pouca interferência de contas maliciosas. Esse framework está sendo construído pelo Grupo de Pesquisa MTPLNAM e será disponibilizado para toda a comunidade sob licença de software livre.pt_BR
dc.description.abstractsThe great growth in the daily use of online social networks by society has made them important sources for studies in various fields. The data generated by these networks are now being used in research for different purposes, ranging from stock market and election forecasting, to human behavior. However, data samples extracted from these networks have become vulnerable to bot activity, automated accounts used to mislead and influence other users. Therefore, this work proposed a supervised approach to knowledge extraction from a literature database, using techniques that aim not only to classify, but to describe the main characteristics of bots on Twitter, thus generating a rule-based classification model. After the interpretation and modeling of the problem, the data were prepared by inserting, modifying, filling and deleting attributes through context information for the different Artificial Intelligence techniques. The Decision Tree built sequential conditions in natural language, demonstrating a performance of 0.97 for AUC-ROC. New rules were generated by induction based on scores in order to find conditions that were neglected by the tree. These rules were assessed by the Coverage, Confidence, and Lift metrics, and demonstrated a high discriminating power. This paper aims to contribute to the Bot Filter layer in the Oracle Framework, which, through a user-friendly interface, aims to collect Twitter data with little interference from malicious accounts. This framework is being built by the MTPLNAM Research Group and will be made available to whole community under open source license.en
dc.description.thesisDissertação (Mestrado Profissional) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, 2019.pt_BR
dc.identifier.citationLEITE, Maria Alice Gomes Lopes. Um modelo baseado em regras para a detecção de bots no Twitter. 2019. 74 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2019.pt_BR
dc.identifier.urihttps://acervo.ufvjm.edu.br/items/8a37448e-48b8-4ce1-ba42-eb0b3783ce2f
dc.language.isopor
dc.publisherUFVJMpt_BR
dc.rightsAcesso Abertopt_BR
dc.rights.licenseA concessão da licença deste item refere-se ao à termo de autorização impresso assinado pelo autor, assim como na licença Creative Commons, com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade Federal dos Vales do Jequitinhonha e Mucuri e o IBICT a disponibilizar por meio de seus repositórios, sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, e preservação, a partir desta data.pt_BR
dc.subject.keywordTwitteren
dc.subject.keywordBotsen
dc.subject.keywordDetecção de botspt_BR
dc.subject.keywordRedes Sociaispt_BR
dc.subject.keywordIndução de regraspt_BR
dc.subject.keywordBot detectionen
dc.subject.keywordSocial networksen
dc.subject.keywordRule inductionen
dc.titleUm modelo baseado em regras para a detecção de bots no Twitterpt_BR
dc.typeDissertaçãopt_BR

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
maria_alice_gomes_lopes_leite.pdf
Size:
1.41 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.11 KB
Format:
Item-specific license agreed upon to submission
Description: