Defesa de Tese de Doutorado N. 46 - Alex Sandro da Cunha Rêgo

postado em 15 de fev de 2016 03:11 por Coordenação da Pós-graduação em Computação da UFCG
Candidato: Alex Sandro da Cunha Rêgo
Título do trabalho: Aprendizado Automático de Relações Semânticas entre Tags de Folksonomias
Orientador(es): Leandro Balby Marinho e Carlos Eduardo Santos Pires

Data: 15/03/2016
Horário: 14h
Local: Aud. do CEEI

Banca examinadora:(mais detalhes abaixo) Dra Ana Carolina Salgado (UFPE), Dra Jussara Marques de Almeida (UFMG), Dr. Claudio Elízio Calazans Campelo, UFCG (UFCG), Dr. Evandro de Barros Costa, UFAL (UFCG). 
Resumo: As folksonomias têm despontado como ferramentas úteis de gerenciamento online de conteúdo digital. A exemplo dos populares websites Delicious, Flickr e BibSonomy, diariamente os usuários utilizam esses sistemas para efetuar upload de recursos web (e.g., url, fotos, vídeos, documentos e referências bibliográficas) e categorizá-los por meio de tags, visando uma posterior recuperação. Tags são palavras-chave definidas livremente pelos usuários que refletem um entendimento subjetivo acerca do conteúdo anotado. A ausência de relações semânticas do tipo sinonímia e hiperonímia/hiponímia no espaço de tags das folksonomias reduz a capacidade do usuário de encontrar recursos relevantes. Para mitigar esse problema, muitos trabalhos de pesquisa se apoiam na aplicação de medidas de similaridade/distância para detecção de sinonímia e construção automática de hierarquias de tags, por meio de algoritmos heurísticos. Nesta tese de doutorado, o problema de detecção de sinonímia e hiperonímia/hiponímia entre pares de tags é modelado como um problema de classificação em Aprendizado de Máquina. A partir da literatura, várias medidas de similaridade consideradas boas indicadores de sinonímia e hiperonímia/hiponímia foram identificadas e empregadas como atributos de aprendizagem. Na conjuntura em que o problema é modelado, observa-se um severo desbalanceamento e sobreposição de classes, o que nos motivou a investigar e empregar técnicas de balanceamento para superar estes problemas. Com a realização de um amplo conjunto de experimentos usando dados reais das folksonomias BibSonomy e Delicious, os resultados mostraram que a abordagem proposta denominada CPDST supera em termos de acurácia o baseline de melhor desempenho na tarefa de detecção de sinonímia (BibSonomy e Delicious) e hiperonímia/hiponímia (BibSonomy). Também, aplicou-se a abordagem CPDST no contexto de geração de listas de tags semanticamente relacionadas, devido à utilidade desse serviço proporcionar acesso a recursos adicionais anotados com outros conceitos pertencentes ao domínio da busca. Além da abordagem CPDST, são propostos dois algoritmos fundamentados no acesso ao WordNet e ConceptNet que oferecem a possibilidade de produzir listas de tags especializadas na captura de sinônimos e hipônimos. O resultado de uma avaliação quantitativa aponta que a abordagem CPDST apresenta listas de tags mais relevantes em comparação com as listas providas pelos métodos comparados.
Comments