ENEM nas redes sociais: mineração de textos e clusterização

Thumbnail Image

Date

2017

Journal Title

Journal ISSN

Volume Title

Publisher

UFVJM

Abstract

A internet é hoje a maior fonte de informação eletrônica existente. Cresce a cada dia o número de usuários da internet, e consequentemente o uso das redes sociais online. São muitas as informações novas que ficam embutidas nas bases de dados textuais. Por causa da sua natureza dinâmica, ou seja, milhões de páginas surgem e desaparecem todos os dias, a tarefa de encontrar informações relevantes nessas bases de dados se torna muito difícil. As técnicas de mineração de textos para a descoberta de informações na web surgiram da necessidade de sanar este problema. O presente trabalho versa sobre a aplicação de métodos de mineração de textos com clusterização na grande quantidade de mensagens sobre o Exame Nacional do Ensino Médio no ano de 2016 provenientes da rede social Twitter. O foco deste estudo está na obtenção de grupos de textos, a fim de possibilitar uma visualização resumida e sintetizada dos assuntos mais comentados pelos usuários. Para manipulação dessas bases textuais, o Modelo Cassiopeia foi utilizado empregando seu algoritmo de agrupamento textual que tem como principal finalidade gerar agrupamentos, ou seja, clusters (grupos) de documentos textuais que apresentam algum tipo de similaridade. O Modelo Cassiopeia apresenta um limite de processamento com a quantidade máxima de 700 tweets. Os tweets passam primeiramente pela fase de limpeza dos textos no pré-processamento, logo após, a utilização do algoritmo no processamento e por fim, as análises dos resultados no pós-processamento. Os resultados obtidos neste trabalho mostram valores coesos quanto à similaridade dos documentos dentro de um cluster e entre os clusters, avaliados por medidas de agrupamento textual, proposto pelo Modelo Cassiopeia. Isso demonstra a aplicabilidade dessa proposta para a visualização sintetizada das informações mais significativas de um determinado tema, muitas vezes permitindo que ações sejam antecipadas e impactos sobre a população afetada sejam reduzidos.

Description

Keywords

Citation

SILVA, Leila Maria. ENEM nas redes sociais: mineração de textos e clusterização. 2017. 90 p. Dissertação (Mestrado Profissional) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2017.

Endorsement

Review

Supplemented By

Referenced By