PPGED - Mestrado Profissional em Educação (Dissertações)

Permanent URI for this collectionhttps://repositorio.ufvjm.edu.br/collections/7dace26e-c209-4368-bebd-d4b441715786

Browse

Search Results

Now showing 1 - 1 of 1
  • Thumbnail Image
    Item
    Framework Oráculo: camada de coleta e mineração de textos para o Twitter
    (UFVJM, 2019) Oliveira, Hércules Batista de; Guelpeli, Marcus Vinícius Carvalho; Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM); Guelpeli, Marcus Vinícius Carvalho; Fonseca, Alexandre Ramos; Villela, Maria Lúcia Bento; Maia, Renato Dourado
    As redes sociais online constituem um importante espaço de convivência para a população, com aplicações em comunicação, diversão, propaganda, mobilização social e comunitária. Os dados compartilhados em tais redes constituem fonte de pesquisa de diversos trabalhos que buscam analisar as interações dos seus usuários. Para que se possam analisar os dados coletados de maneira eficiente, devido ao grande volume produzido por essas redes, faz-se necessária a utilização de técnicas de mineração de textos. Nesse processo de mineração de texto apresenta-se o desafio da falta de acesso direto aos dados das redes sociais online, o que torna necessário utilizar ferramentas especializadas para realizar a coleta de dados. O framework Oráculo, em desenvolvimento pelo grupo de pesquisa MTPLNAM, é formado por diferentes camadas. Nesta pesquisa foi desenvolvida a camada de coleta e mineração de textos, que aplica diferentes técnicas e algoritmos para coletar texto do Twitter, buscando contornar as limitações impostas pela API disponibilizada por ele, e integra um minerador de textos para analisar as coletas realizadas. Essa camada do framework dispõe de interface web, permitindo a utilização por pesquisadores não familiarizados com a área de computação. Foram realizados testes comparativos de desempenho entre o framework Oráculo e outra ferramenta semelhante de coleta e mineração de textos, o DMIT-CAT. Os resultados desses testes apontam que o framework Oráculo teve desempenho superior ao DMI-TCAT em número de tweets coletados nos cenários analisados. Testes estatísticos foram executados e validaram os resultados dos testes de desempenho.