Framework Oráculo: camada de coleta e mineração de textos para o Twitter

dc.contributor.advisorGuelpeli, Marcus Vinícius Carvalho
dc.contributor.authorOliveira, Hércules Batista de
dc.contributor.institutionUniversidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM)pt_BR
dc.contributor.refereeGuelpeli, Marcus Vinícius Carvalho
dc.contributor.refereeFonseca, Alexandre Ramos
dc.contributor.refereeVillela, Maria Lúcia Bento
dc.contributor.refereeMaia, Renato Dourado
dc.date.accessioned2020-09-15T19:31:07Z
dc.date.available2020-09-15T19:31:07Z
dc.date.issued2019
dc.date.submitted2019-11-08
dc.description.abstractAs redes sociais online constituem um importante espaço de convivência para a população, com aplicações em comunicação, diversão, propaganda, mobilização social e comunitária. Os dados compartilhados em tais redes constituem fonte de pesquisa de diversos trabalhos que buscam analisar as interações dos seus usuários. Para que se possam analisar os dados coletados de maneira eficiente, devido ao grande volume produzido por essas redes, faz-se necessária a utilização de técnicas de mineração de textos. Nesse processo de mineração de texto apresenta-se o desafio da falta de acesso direto aos dados das redes sociais online, o que torna necessário utilizar ferramentas especializadas para realizar a coleta de dados. O framework Oráculo, em desenvolvimento pelo grupo de pesquisa MTPLNAM, é formado por diferentes camadas. Nesta pesquisa foi desenvolvida a camada de coleta e mineração de textos, que aplica diferentes técnicas e algoritmos para coletar texto do Twitter, buscando contornar as limitações impostas pela API disponibilizada por ele, e integra um minerador de textos para analisar as coletas realizadas. Essa camada do framework dispõe de interface web, permitindo a utilização por pesquisadores não familiarizados com a área de computação. Foram realizados testes comparativos de desempenho entre o framework Oráculo e outra ferramenta semelhante de coleta e mineração de textos, o DMIT-CAT. Os resultados desses testes apontam que o framework Oráculo teve desempenho superior ao DMI-TCAT em número de tweets coletados nos cenários analisados. Testes estatísticos foram executados e validaram os resultados dos testes de desempenho.pt_BR
dc.description.abstractsOnline social networks are an important social space for the population, with applications in communication, entertainment, advertising, social and community mobilization. The data shared in such networks is a source of research for several works that seek to analyze the interactions of their users. In order to analyze the collected data efficiently, due to the large volume produced by these networks, it is necessary to use text mining techniques. This text mining process presents the challenge of the lack of direct access to data from online social networks, which makes it necessary to use specialized tools to perform data collection. The Oracle framework, under development by the MTPLNAM research group, is made up of different layers. This research developed the text collection and mining layer, which applies different techniques and algorithms to collect text from Twitter, seeking to circumvent the limitations imposed by the API provided by Twitter, and integrates a text miner to analyze the collections made. This layer of the framework has web interface, allowing the use by researchers unfamiliar with the area of computing. Comparative performance tests were performed between the Oracle framework and another similar text collection and mining tool, DMI-TCAT. The results of these tests indicate that the Oracle framework outperformed the DMI-TCAT in the number of tweets collected in the analyzed scenarios. Statistical tests were performed and validated the results of the performance tests.en
dc.description.thesisDissertação (Mestrado Profissional) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, 2019.pt_BR
dc.identifier.citationOLIVEIRA, Hércules Batista de. Framework Oráculo: camada de coleta e mineração de textos para o Twitter. 2019. 73 p. Dissertação (Mestrado Profissional em Educação) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2019.pt_BR
dc.identifier.urihttps://acervo.ufvjm.edu.br/items/183e3b4f-40cd-4fb2-bb6a-e0806bd2740d
dc.language.isopor
dc.publisherUFVJMpt_BR
dc.rightsAcesso Abertopt_BR
dc.rights.licenseA concessão da licença deste item refere-se ao à termo de autorização impresso assinado pelo autor, assim como na licença Creative Commons, com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade Federal dos Vales do Jequitinhonha e Mucuri e o IBICT a disponibilizar por meio de seus repositórios, sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, e preservação, a partir desta data.pt_BR
dc.subject.keywordColeta de textospt_BR
dc.subject.keywordMineração de textospt_BR
dc.subject.keywordTwitteren
dc.subject.keywordText collecten
dc.subject.keywordText miningen
dc.titleFramework Oráculo: camada de coleta e mineração de textos para o Twitterpt_BR
dc.typeDissertaçãopt_BR

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
hercules_batista_oliveira.pdf
Size:
3.08 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
2.11 KB
Format:
Item-specific license agreed upon to submission
Description: