Pós-Graduação em Educação
Permanent URI for this communityhttps://repositorio.ufvjm.edu.br/communities/6e04c5af-29a2-4305-bbeb-1cb7813f7adc
PPGED - Programa de Pós-Graduação em Educação
Disponíveis também trabalhos do antigo Programa de Pós-Graduação em Gestão de Instituições Educacionais (PPGGIEd).
Browse
2 results
Search Results
Item AnoTex: anotador de artigo científico para retextualização automática(UFVJM, 2018) Fonseca, Cláudia Aparecida; Guelpeli, Marcus Vinícius Carvalho; Bodolay, Adriana Nascimento; Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM); Guelpeli, Marcus Vinícius Carvalho; Bodolay, Adriana Nascimento; Fonseca, Alexandre Ramos; Horta, Euler Guimarães; Maia, Renato Dourado; Carvalho, Leonardo Lana deEste trabalho foi desenvolvido no Mestrado Profissional Interdisciplinar em Educação, na área de Educação e Tecnologias Aplicadas em Instituições Educacionais, cujo propósito inicial foi demonstrar a necessidade de uma estreita relação entre um sistema de anotação automática de texto com a análise do gênero do texto base. A anotação textual deve representar as mais variadas formas, níveis e modalidades de manifestação da linguagem verbal que envolve, além dos aspectos semânticos e morfossintáticos, aspectos do discurso que também podem transmitir informações. Para alcançar os objetivos propostos, na análise dos dados estruturados do gênero e na abordagem da relação entre o sistema de anotação do corpus de estudo e o processamento automático, foi proposta a criação de um modelo computacional necessário para a compilação do Corpus linguístico, especializado, representativo do gênero artigo científico. O projeto teve como objeto de estudo os elementos representativos do gênero textual artigo científico, marcados em XML, extraídos e coletados do banco de dados da Biblioteca Eletrônica SciELO. Os dados, que compuseram o corpus de estudo, foram coletados automaticamente, pré-processados, categorizados e disponibilizados em bancos de árvore, pela ferramenta computacional para a anotação textual - AnoTex, que possibilita uma visualização e interação para análises qualitativas e quantitativas dos dados coletados. Como produto final do processo de extração, obteve-se uma base de dados com as informações extraídas e estruturadas no formato XML, que delimitam e identificam as marcações do gênero em análise, disponível para várias ferramentas e aplicações. Os resultados demonstram como a categorização dos elementos constitutivos do gênero, pode condensar as informações disponíveis de forma hierarquizada e dinâmica, construídas durante a compilação. Dentre elas, foi destacada a estrutura básica do artigo científico constituída por seus elementos pré-textuais , textuais e pós-textuais . Para a compilação, anotação, compreensão e validação do corpus, foram utilizados os conceitos de Linguística Textual, Linguística de Corpus e Processamento de Linguagem Natural. Essas áreas de conhecimento exploram as relações entre linguística e informática, tornando possível a construção de sistemas computacionais com capacidade de reconhecer, localizar e produzir informação apresentada em linguagem natural.Item PragmaSUM: novos métodos na utilização de palavras-chave na sumarização automática(UFVJM, 2017) Rocha, Valdir Júnior Cordeiro; Guelpeli, Marcus Vinícius Carvalho; Universidade Federal dos Vales do Jequitinhonha e Mucuri (UFVJM); Guelpeli, Marcus Vinícius Carvalho; Berti, Cláudia Beatriz; Horta, Euler Guimarães; Fonseca, Alexandre RamosCom a ampliação do acesso à internet e a criação de ferramentas que possibilitam pessoas a criarem conteúdo, a informação disponível cresce de forma acelerada. Textos sobre os mais diversos assuntos e autores são criados todos os dias. É impossível absorver a quantidade de informação disponível, o que dificulta a escolha da mais adequada para determinado interesse ou público. A sumarização automática de textos, além de apresentar um texto de forma condensada, pode simplifica-lo, gerando uma alternativa para ganho de tempo e ampliação do acesso a informação contida aos mais diferentes tipos de leitores. Os sumarizadores automáticos existentes atualmente na literatura não apresentam métodos de personificação dos sumários para cada tipo de leitor, e consequentemente geram resultados pouco precisos. Este trabalho tem como objetivo utilizar o sumarizador automático de textos PragmaSUM em textos educacionais com novas técnicas de sumarização utilizando palavras-chave. A utilização de métodos de personificação do sumário com palavras-chave visa aumentar a precisão e melhorar o desempenho do PragmaSUM e seus sumários. Para isto, um corpus formado apenas por artigos científicos da área educacional foi criado para realização de testes e comparações entre diferentes sumarizadores e métodos de sumarização. O desempenho dos sumarizadores foi medido pelas métricas Recall, Precision e F-Measure presentes na ferramenta ROUGE e validados com os testes estatísticos ANOVA de Friedman e Coeficiente de Concordância de Kendall. Os resultados obtidos apontam uma melhora no desempenho com a utilização de palavras-chave na sumarização com o PragmaSUM, indicando a importância na escolha adequada destas palavras-chave para classificação do conteúdo do texto fonte.