Defesa de dissertação de Magna Bispo, 30/11, 9h

postado em 9 de nov de 2012 06:59 por Nazareno Ferreira de Andrade
Candidato: Magna Celi Tavares Bispo
Título do trabalho: Criação de Vetores Temáticos de Domínios para a Desambiguação Polissêmica de Termos
Orientador(es): Ulrich Schiel Carlos Eduardo Santos Pires

Data: 30/11/2012
Horário: 9h
Local: Auditório do CEEI

Banca examinadora: Edberto Ferneda (Universidade Estadual Paulista - UNESP), Leandro Balby Marinho (UFCG), 
 
Resumo: A ambiguidade dos termos existentes em um texto é um dos principais fatores que dificultam uma melhor qualidade na recuperação da informação desejada por um usuário. O presente trabalho se baseia na hipótese de que parte desta ambiguidade pode ser eliminada sabendo-se de antemão o domínio do documento que contém termos ambíguos. Para determinar este domínio foram construídos vocabulários típicos de diversos domínios do conhecimento extraindo termos de documentos de domínios do conhecimento pré-determinados, através de regras criadas e adicionadas a um extrator de termos. Foram utilizadas categorias existentes na Wikipédia como domínios e as respectivas entradas da Wikipédia como documentos para a criação dos vocabulários. A escolha das categorias foi baseada na Classificação Decimal Universal (CDU), composta de 10 domínios e seus respectivos subdomínios. Os vocabulários obtidos, denominados de Vetores Temáticos, serviram de base para a classificação de novos documentos. Para classificar um documento, o conjunto de termos contidos nele foi comparado com estes vocabulários. Para validação do trabalho, foi analisada a acurácia da classificação de novos documentos de domínios conhecidos, comparando-os com os Vetores Temáticos pelo método do modelo vetorial. Também foi realizada uma comparação com outro classificador, o Intellexer Categorizer 
Comments