PragmaSUM: novos métodos na utilização de palavras-chave na sumarização automática
Date
2017
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
UFVJM
Abstract
Com a ampliação do acesso à internet e a criação de ferramentas que possibilitam pessoas a criarem conteúdo, a informação disponível cresce de forma acelerada. Textos sobre os mais diversos assuntos e autores são criados todos os dias. É impossível absorver a quantidade de informação disponível, o que dificulta a escolha da mais adequada para determinado interesse ou público. A sumarização automática de textos, além de apresentar um texto de forma condensada, pode simplifica-lo, gerando uma alternativa para ganho de tempo e ampliação do acesso a informação contida aos mais diferentes tipos de leitores. Os sumarizadores automáticos existentes atualmente na literatura não apresentam métodos de personificação dos sumários para cada tipo de leitor, e consequentemente geram resultados pouco precisos. Este trabalho tem como objetivo utilizar o sumarizador automático de textos PragmaSUM em textos educacionais com novas técnicas de sumarização utilizando palavras-chave. A utilização de métodos de personificação do sumário com palavras-chave visa aumentar a precisão e melhorar o desempenho do PragmaSUM e seus sumários. Para isto, um corpus formado apenas por artigos científicos da área educacional foi criado para realização de testes e comparações entre diferentes sumarizadores e métodos de sumarização. O desempenho dos sumarizadores foi medido pelas métricas Recall, Precision e F-Measure presentes na ferramenta ROUGE e validados com os testes estatísticos ANOVA de Friedman e Coeficiente de Concordância de Kendall. Os resultados obtidos apontam uma melhora no desempenho com a utilização de palavras-chave na sumarização com o PragmaSUM, indicando a importância na escolha adequada destas palavras-chave para classificação do conteúdo do texto fonte.
Description
Keywords
Citation
ROCHA, Valdir Júnior Cordeiro. PragmaSUM: novos métodos na utilização de palavras-chave na sumarização automática. 2017. 88 p. Dissertação (Mestrado Profissional) – Programa de Pós-Graduação em Educação, Universidade Federal dos Vales do Jequitinhonha e Mucuri, Diamantina, 2017.