Autor |
Silva, Cassiana Fagundes da; |
Lattes do autor |
http://lattes.cnpq.br/0460699375310678; |
Orientador |
Vieira, Renata; |
Instituição |
Universidade do Vale do Rio do Sinos; |
Sigla da instituição |
UNISINOS; |
País da instituição |
Brasil; |
Instituto/Departamento |
Escola Politécnica; |
Idioma |
pt_BR; |
Título |
Uso de informações lingüísticas na etapa de pré - processamento em mineração de textos; |
Resumo |
Este trabalho apresenta estudos, com realização de experimentos e análise de
resultados, da aplicação de informações lingüísticas na etapa de pré-processamento no
processo de Mineração de Textos para as tarefas de Categorização e Agrupamento de
Documentos.
Usualmente, o pré-processamento utilizado no processo de Mineração de Textos
para estas tarefas consiste na remoção de termos irrelevantes (tais como, preposição,
artigos, pronomes, entre outros), normalização morfológica e seleção dos termos (ao
que denominamos baseado em métodos usuais). Propõe-se, ao longo deste trabalho, um
pré-processamento que faz o uso de informações lingüísticas, ou seja, um préprocessamento
baseado em combinações gramaticais, visando avaliar a repercussão do
uso dessas informações nos resultados de tarefas de Mineração de Textos.
Foram realizados diversos experimentos para a validação da abordagem
proposta junto à língua portuguesa. O corpus utilizado nos experimentos consiste de um
extrato do corpus NILC (Núcleo Inter; |
Palavras-chave |
categorização e agrupamento de texto; computação; informações linguísticas; mineração de textos; linguística; mineração de textos; |
Área(s) do conhecimento |
Ciências Exatas e da Terra; |
Tipo |
Dissertação; |
Data de defesa |
2004-02-27; |
Agência de fomento |
Nenhuma; |
Direitos de acesso |
openAccess; |
URI |
http://www.repositorio.jesuita.org.br/handle/UNISINOS/2195; |
Programa |
Programa de Pós-Graduação em Computação Aplicada; |