Defesa de exame de qualificação, 17/08/2012, 8h30

postado em 15 de jun de 2012 11:46 por Nazareno Ferreira de Andrade   [ 12 de jul de 2012 04:16 atualizado‎(s)‎ ]
Candidato: Vladimir Catão
Título: DBFIRe: Recuperação de Informação Utilizando Bancos de Dados como Evidência de Relevância
Banca examinadora: Marcus Costa Sampaio (DSC/UFCG), Ulrich Schiel (DSC/UFCG), Carlos Eduardo Pires (DSC/UFCG), Leandro Balby Marinho (DSC/UFCG), Edberto Ferneda (USP - Ribeirão Preto), Altigran Soares da Silva (UFAM)

Data: 17/08/2012 (alterada)
Local: Auditório do CEEI


Resumo: As áreas de Bancos de Dados (BDs) e de Recuperação da Informação (RI) lidam com dados de naturezas distintas (estruturados, no caso dos BDs,e não estruturados quando se trata de RI). Normalmente esses dois mundos convivem separadamente nas organizações, a despeito de frequentemente se referirem a entidades ou objetos em comum. No entanto, cada vez mais a integração desses ambientes diferentes tem recebido atenção da comunidade acadêmica, visando prover uma melhor experiência para o usuário final. Um dos problemas investigados é a descoberta de documentos relevantes acerca de uma consulta estruturada qualquer. Assim, para uma consulta do tipo "Quais os clientes com contratos acima de X reais?", diversos documentos dentro da organização poderiam estar relacionados: os próprios contratos desses clientes, ou propostas de novas vendas em aberto, entre outros. Para encontrar tais documentos, o que se faz é procurar termos potencialmente relevantes a partir da consulta para serem posteriormente enviados a um Sistema de Recuperação de Informação (SRI). Na literatura, duas estratégias se destacam: ou se procura os termos no resultado da consulta ou se volta para o corpo da sentença de consulta. Nesta monografia se investigará a unificação dessas duas estratégias em conjunto com um método de retroalimentação cega para melhorar o desempenho da tarefa, encontrando mais documentos relevantes. Retroalimentação cega é uma técnica de RI que consiste em executar a consulta em dois passos: num primeiro passo, executa-se internamente a consulta original e os primeiros documentos são analisados; num segundo momento termos extras descobertos durante a fase de análise são adicionados à consulta original que é então executada em seguida. O método aqui descrito consistiu em adaptar a estratégia de retroalimentação cega considerando termos presentes no corpo da consulta como semente para a retroalimentação, e usando o resultado da consulta como fonte dos termos adicionais para a consulta definitiva. Os primeiros experimentos indicam uma melhoria de cerca de 30% em média com relação a outras abordagens.

Comments