RDBU| Repositório Digital da Biblioteca da Unisinos

Ensepro: engenho semântico de pergunta e resposta baseado em ontologia

Mostrar registro simples

Autor Araujo, Denis Andrei de;
Lattes do autor http://lattes.cnpq.br/0653508226724589;
Orientador Rigo, Sandro José;
Lattes do orientador http://lattes.cnpq.br/3914159735707328;
Instituição Universidade do Vale do Rio dos Sinos;
Sigla da instituição Unisinos;
País da instituição Brasil;
Instituto/Departamento Escola Politécnica;
Idioma pt_BR;
Título Ensepro: engenho semântico de pergunta e resposta baseado em ontologia;
Resumo Há uma grande expectativa em relação ao uso da linguagem natural como interface de comunicação com as máquinas. Dentre as várias aplicações que implementam tal interface, despontam os sistemas de Pergunta e Resposta Semânticos, os quais possibilitam localização de informações em bases de conhecimento a partir de perguntas formuladas em linguagem natural. Percebe-se nos trabalhos em andamento uma tendência à implementação de soluções baseadas nas informações léxicas e morfológicas das perguntas, desprezando-se as informações abstratas de nível mais elevado do processamento linguístico. Esta tese apresenta uma abordagem que explora de forma aprofundada as informações sintáticas e estruturais das perguntas, fundamentando-se nestes níveis mais elevados da linguística para depreender o significado de frases e assim localizar respostas nas bases de conhecimentos semânticas. A abordagem propõem um modelo que faz uso das informações linguísticas da pergunta para determinar o seu tipo e selecionar as palavras chaves que serão utilizadas para a busca de respostas na base de conhecimento. Ao contrário de outros trabalhos, o modelo propõem uma solução baseada em linguística integrada a outras duas diferentes técnicas de implementação, visando apresentar uma solução que explore as vantagens que cada técnica oferece. A abordagem usa as informações morfossintáticas e estruturais da frase para determinar o tipo da pergunta e para selecionar as suas palavras chaves. Posteriormente, utiliza novamente as informações linguísticas para otimizar o desempenho do algoritmo baseado em grafo para geração e ranqueamento de candidatas a resposta. Por fim, caso o uso integrado das informações linguísticas com a técnica baseada em grafos não seja suficiente para a seleção inequívoca das respostas, a abordagem busca apoio na semântica latente do word embedding para validar as respostas. Os experimentos de avaliação da abordagem mostraram um desempenho acima dos demais concorrentes, apresentando Escore F1 micro de 0,56 e Escore F1 macro de 0,593.;
Abstract There is great expectation regarding the use of natural language as an interface of communication with machines. Among the several applications that implement such an interface, the Semantic Question Answering systems arises, enabling the localization of information in knowledge bases from questions formulated in natural language. It is possible to notice in the work in progress a tendency to implement solutions based on the lexical and morphological information of the questions, ignoring the higher level abstract information of the linguistic processing. This thesis presents an approach that explores in depth the syntactic and structural information of the questions, based on these higher levels of linguistics to understand the meaning of the words and to find answers in semantic knowledge bases. This approach proposes a model that makes use of the linguistic information of the question to determine its type and select the keywords that will be used to search answers in the knowledge base. Unlike other works, the model proposes a solution based on linguistics integrated with two different implementation techniques, aiming to present a solution that exploits the advantages that each technique offers. The approach uses the morphosyntactic and structural informations of the sentence to determine the type of the question and to select its key words. Later, it uses linguistic information to optimize the performance of the algorithm of generation and ranking of candidates for the response based on graph. Finally, if the integrated use of linguistic information with the graph-based technique is not enough for the unequivocal selection of the answer, our approach look for support in the latent semantics of word embedding to validate the answers. The experiments of evaluation of the approach showed a performance above the other competitors, with a score F1 micro of 0.56 and F1 score Macro of 0.593.;
Palavras-chave Sistema de Pergunta e Resposta Semântico; Processamento da Linguagem Natural; Grafos; Word Embedding; Semantic Question Answering; Natural Language Processing; Graphs; Word Embedding;
Área(s) do conhecimento ACCNPQ::Ciências Exatas e da Terra::Ciência da Computação;
Tipo Tese;
Data de defesa 2019-09-13;
Agência de fomento CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior;
Direitos de acesso openAccess;
URI http://www.repositorio.jesuita.org.br/handle/UNISINOS/9080;
Programa Programa de Pós-Graduação em Computação Aplicada;


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples

Buscar

Busca avançada

Navegar

Minha conta

Estatística