Um modelo baseado em regras para a detecção de bots no Twitter
dc.contributor.advisor | Guelpeli, Marcus Vinícius Carvalho | |
dc.contributor.advisorco | Santos, Caroline Queiroz | |
dc.contributor.author | Leite, Maria Alice Gomes Lopes | |
dc.contributor.institution | Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM) | pt_BR |
dc.contributor.referee | Santos, Caroline Queiroz | |
dc.contributor.referee | Villela, Maria Lúcia Bento | |
dc.contributor.referee | Maia, Renato Dourado | |
dc.date.accessioned | 2022-02-01T14:29:40Z | |
dc.date.available | 2022-02-01T14:29:40Z | |
dc.date.issued | 2019 | |
dc.date.submitted | 2019-12-12 | |
dc.description.abstract | O grande crescimento do uso cotidiano das redes sociais on-line pela sociedade transformou-as em importantes fontes de estudos em diversas áreas. Os dados gerados por essas redes passaram a ser utilizados em pesquisas de diferentes fins, que vão desde a previsão do mercado de ações e resultados de eleições, até o comportamento humano. Porém, as amostras de dados extraídas dessas redes tornaram-se vulneráveis às atividades dos bots, contas automatizadas utilizadas com o objetivo de enganar e influenciar outros usuários. Diante disso, este trabalho propôs uma abordagem supervisionada de extração de conhecimento de uma base de dados da literatura, por meio de técnicas que visam não somente classificar, mas descrever as principais características dos bots no Twitter, gerando assim um modelo de classificação baseado em regras. Após a interpretação e modelagem do problema, os dados foram preparados, inserindo, modificando, preenchendo e excluindo atributos por meio de informações de contexto para as diferentes técnicas de Inteligência Artificial aplicadas. A Árvore de Decisão construiu condições sequenciais em linguagem natural, demonstrando um poder de classificação de 0,97 para a AUC-ROC. Novas regras foram geradas,por meio de indução, baseada em escores, a fim de encontrar condicões que foram negligenciadas pela árvore. Essas regras foram avaliadas pela métricas de Cobertura, Confiança e Lift, e demonstraram um alto poder discriminante. Este trabalho visa contribuir com a camada de filtro de bots no Framework Oráculo, que, por meio de uma interface amigável, visa coletar dados do Twitter com pouca interferência de contas maliciosas. Esse framework está sendo construído pelo Grupo de Pesquisa MTPLNAM e será disponibilizado para toda a comunidade sob licença de software livre. | pt_BR |
dc.description.abstracts | The great growth in the daily use of online social networks by society has made them important sources for studies in various fields. The data generated by these networks are now being used in research for different purposes, ranging from stock market and election forecasting, to human behavior. However, data samples extracted from these networks have become vulnerable to bot activity, automated accounts used to mislead and influence other users. Therefore, this work proposed a supervised approach to knowledge extraction from a literature database, using techniques that aim not only to classify, but to describe the main characteristics of bots on Twitter, thus generating a rule-based classification model. After the interpretation and modeling of the problem, the data were prepared by inserting, modifying, filling and deleting attributes through context information for the different Artificial Intelligence techniques. The Decision Tree built sequential conditions in natural language, demonstrating a performance of 0.97 for AUC-ROC. New rules were generated by induction based on scores in order to find conditions that were neglected by the tree. These rules were assessed by the Coverage, Confidence, and Lift metrics, and demonstrated a high discriminating power. This paper aims to contribute to the Bot Filter layer in the Oracle Framework, which, through a user-friendly interface, aims to collect Twitter data with little interference from malicious accounts. This framework is being built by the MTPLNAM Research Group and will be made available to whole community under open source license. | en |
dc.description.thesis | Dissertação (Mestrado Profissional) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, 2019. | pt_BR |
dc.identifier.citation | LEITE, Maria Alice Gomes Lopes. Um modelo baseado em regras para a detecção de bots no Twitter. 2019. 74 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2019. | pt_BR |
dc.identifier.uri | https://acervo.ufvjm.edu.br/items/8a37448e-48b8-4ce1-ba42-eb0b3783ce2f | |
dc.language.iso | por | |
dc.publisher | UFVJM | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.rights.license | A concessão da licença deste item refere-se ao à termo de autorização impresso assinado pelo autor, assim como na licença Creative Commons, com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade Federal dos Vales do Jequitinhonha e Mucuri e o IBICT a disponibilizar por meio de seus repositórios, sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, e preservação, a partir desta data. | pt_BR |
dc.subject.keyword | en | |
dc.subject.keyword | Bots | en |
dc.subject.keyword | Detecção de bots | pt_BR |
dc.subject.keyword | Redes Sociais | pt_BR |
dc.subject.keyword | Indução de regras | pt_BR |
dc.subject.keyword | Bot detection | en |
dc.subject.keyword | Social networks | en |
dc.subject.keyword | Rule induction | en |
dc.title | Um modelo baseado em regras para a detecção de bots no Twitter | pt_BR |
dc.type | Dissertação | pt_BR |