Pós-Graduação em Educação
Permanent URI for this communityhttps://repositorio.ufvjm.edu.br/communities/6e04c5af-29a2-4305-bbeb-1cb7813f7adc
PPGED - Programa de Pós-Graduação em Educação
Disponíveis também trabalhos do antigo Programa de Pós-Graduação em Gestão de Instituições Educacionais (PPGGIEd).
Browse
Search Results
Item ENEM nas redes sociais: mineração de textos e clusterização(UFVJM, 2017) Silva, Leila Maria; Guelpeli, Marcus Vinícius Carvalho; Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM); Guelpeli, Marcus Vinícius Carvalho; Fonseca, Alexandre Ramos; Sabino, Geruza de Fátima Tomé; Villela, Maria Lucia BentoA internet é hoje a maior fonte de informação eletrônica existente. Cresce a cada dia o número de usuários da internet, e consequentemente o uso das redes sociais online. São muitas as informações novas que ficam embutidas nas bases de dados textuais. Por causa da sua natureza dinâmica, ou seja, milhões de páginas surgem e desaparecem todos os dias, a tarefa de encontrar informações relevantes nessas bases de dados se torna muito difícil. As técnicas de mineração de textos para a descoberta de informações na web surgiram da necessidade de sanar este problema. O presente trabalho versa sobre a aplicação de métodos de mineração de textos com clusterização na grande quantidade de mensagens sobre o Exame Nacional do Ensino Médio no ano de 2016 provenientes da rede social Twitter. O foco deste estudo está na obtenção de grupos de textos, a fim de possibilitar uma visualização resumida e sintetizada dos assuntos mais comentados pelos usuários. Para manipulação dessas bases textuais, o Modelo Cassiopeia foi utilizado empregando seu algoritmo de agrupamento textual que tem como principal finalidade gerar agrupamentos, ou seja, clusters (grupos) de documentos textuais que apresentam algum tipo de similaridade. O Modelo Cassiopeia apresenta um limite de processamento com a quantidade máxima de 700 tweets. Os tweets passam primeiramente pela fase de limpeza dos textos no pré-processamento, logo após, a utilização do algoritmo no processamento e por fim, as análises dos resultados no pós-processamento. Os resultados obtidos neste trabalho mostram valores coesos quanto à similaridade dos documentos dentro de um cluster e entre os clusters, avaliados por medidas de agrupamento textual, proposto pelo Modelo Cassiopeia. Isso demonstra a aplicabilidade dessa proposta para a visualização sintetizada das informações mais significativas de um determinado tema, muitas vezes permitindo que ações sejam antecipadas e impactos sobre a população afetada sejam reduzidos.Item Modelo Cassiopeia como avaliador de sumários automáticos: aplicação em um corpus educacional(UFVJM, 2017) Aguiar, Luís Henrique Gonçalves de; Guelpeli, Marcus Vinícius Carvalho; Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM); Guelpeli, Marcus Vinícius Carvalho; Horta, Euler Guimarães; Berti, Cláudia Beatriz; Fonseca, Alexandre RamosConsiderando a grande quantidade de informações textuais disponíveis atualmente, principalmente na web, está se tronando cada vez mais difícil o acesso e a assimilação desse conteúdo para o usuário. Nesse contexto, torna-se necessário buscar tarefas capazes de transformar essa grande quantidade de dados em conhecimento útil e organizado. Uma alternativa para amenizar esse problema, é reduzir o volume de informações disponíveis a partir da produção de resumos dos textos originais, por meio da sumarização automática (SA) de textos. A sumarização automática de textos consiste na produção automática de resumos a partir de um ou mais textos-fonte, de modo que o sumário contenha as informações mais relevantes deste. A avaliação de resumos é uma tarefa importante no campo da sumarização automática de texto, a abordagem mais intuitiva é a avaliação humana, porém é onerosa e improdutiva. Outra alternativa é a avaliação automática, alguns avaliadores foram propostos, sendo a mais conhecida e amplamente usada é a medida ROUGE (Recall-Oriented Understudy for Gisting Evaluation). Um fator limitante na avaliação da ROUGE é a utilização do sumário humano de referência, o que implica em uma restrição do idioma e domínio, além de requerer um trabalho humano demorado e oneroso. Diante das dificuldades encontradas na avaliação de sumários automáticos, o presente trabalho apresenta o modelo Cassiopeia como um novo método de avaliação. O modelo é um agrupador de textos hierárquico, o qual consiste no uso da sumarização na etapa do pré-processamento, onde a qualidade do agrupamento é influenciada positivamente conforme a qualidade da sumarização. As simulações realizadas neste trabalho mostraram que a avaliação realizada pelo modelo Cassiopeia é semelhante a avaliação realizada pela ferramenta ROUGE. Por outro lado, a utilização do modelo Cassiopeia como avaliador de sumários automáticos evidenciou algumas vantagens, sendo as principais; a não utilização do sumário humano no processo de avaliação, e a independência do domínio e do idioma.