ENEM nas redes sociais: mineração de textos e clusterização
Date
2017
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
UFVJM
Abstract
A internet é hoje a maior fonte de informação eletrônica existente. Cresce a cada dia o número
de usuários da internet, e consequentemente o uso das redes sociais online. São muitas
as informações novas que ficam embutidas nas bases de dados textuais. Por causa da sua natureza
dinâmica, ou seja, milhões de páginas surgem e desaparecem todos os dias, a tarefa de
encontrar informações relevantes nessas bases de dados se torna muito difícil. As técnicas de
mineração de textos para a descoberta de informações na web surgiram da necessidade de
sanar este problema. O presente trabalho versa sobre a aplicação de métodos de mineração
de textos com clusterização na grande quantidade de mensagens sobre o Exame Nacional do
Ensino Médio no ano de 2016 provenientes da rede social Twitter. O foco deste estudo está
na obtenção de grupos de textos, a fim de possibilitar uma visualização resumida e sintetizada
dos assuntos mais comentados pelos usuários. Para manipulação dessas bases textuais, o
Modelo Cassiopeia foi utilizado empregando seu algoritmo de agrupamento textual que tem como
principal finalidade gerar agrupamentos, ou seja, clusters (grupos) de documentos textuais
que apresentam algum tipo de similaridade. O Modelo Cassiopeia apresenta um limite de processamento
com a quantidade máxima de 700 tweets. Os tweets passam primeiramente pela fase de
limpeza dos textos no pré-processamento, logo após, a utilização do algoritmo no processamento
e por fim, as análises dos resultados no pós-processamento. Os resultados obtidos neste trabalho
mostram valores coesos quanto à similaridade dos documentos dentro de um cluster e entre os
clusters, avaliados por medidas de agrupamento textual, proposto pelo Modelo Cassiopeia. Isso
demonstra a aplicabilidade dessa proposta para a visualização sintetizada das informações
mais significativas de um determinado tema, muitas vezes permitindo que ações sejam antecipadas
e impactos sobre a população afetada sejam reduzidos.
Description
Keywords
Citation
SILVA, Leila Maria. ENEM nas redes sociais: mineração de textos e clusterização. 2017. 90 p. Dissertação (Mestrado Profissional) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2017.