Trabalho de Conclusão
Título:Ontologia Terminológica para apoio a ferramentas de Recuperação de Informações e de Text Mining
Aluno:Júnior Becker
Semestre:2006/01
Situação:Concluido
Áreas de interesse:Não informado
Orientador:Rodrigo Rafael V. Goulart
Avaliadores:Alexandre de Oliveira Zamberlam, Cláudia Camerini Correa Perez
Documentos:Anteprojeto, Texto final TC1, Texto final TC2
Palavras-chave:Recuperação da Informação, Text Mining, Ontologia Terminológica, Expansão Semântica.
Resumo:

Este trabalho tem como contexto a Recuperação de Informações (RI). Esta área da Computação visa fornecer recursos à sociedade em geral na busca de informações em diversos contextos. Outra área a ser considerada é a de Text Mining (TM), que pode ser definida como um processo para a extração de conhecimento a partir de bases textuais. Basicamente, o foco da primeira área consiste em retornar os documentos que contenham em seu texto as palavras fornecidas pelo usuário como parâmetros de um processo de busca e o da segunda em identificar relações e padrões entre documentos ou entre palavras presentes nos documentos. Entre os problemas desta abordagem baseada em palavras destacam-se: a possibilidade de diferentes termos, porém sinônimos, serem utilizados freqüentemente nos documentos; e a tendência das pessoas em utilizar diferentes termos de busca para a mesma informação. Estes problemas fazem com que alguns documentos relevantes não sejam retornados – por não possuírem os mesmos termos em seu texto – e/ou que documentos irrelevantes o sejam. Alguns trabalhos apontam o uso de estruturas que armazenam relações entre palavras (tais como hiperdicionários e lexicons) como solução para estes problemas. De uma forma semelhante este projeto utiliza-se de ontologias na busca pela minimização dos problemas indicados anteriormente, a qual armazena palavras, seus sinônimos e relacionamentos hierárquicos (generalidade e especificidade), permitindo que as ferramentas de RI ou de TM utilizem-se destes dados na qualificação de seus resultados.

Link biblioteca:Não informado