Explorando Dados Abertos para Melhoria de Aplicações de Busca Espacial baseado em Palavras-Chave

Banca de DEFESA: JOÃO PAULO DIAS DE ALMEIDA

Uma banca de DEFESA de DOUTORADO foi cadastrada pelo programa.

DISCENTE : JOÃO PAULO DIAS DE ALMEIDA

DATA : 03/05/2021

HORA: 08:30

LOCAL: Google Meet (https://meet.google.com/gzo-qwzm-byw)

TÍTULO:

Explorando Dados Abertos para Melhoria de Aplicações de Busca Espacial baseado em Palavras-Chave



PALAVRAS-CHAVES:

dados especiais, consultas espaciais, dados ligados abertos, avaliação de busca, processamento de busca, personalização



PÁGINAS: 191

RESUMO:

A popularização das redes sociais e aplicativos para smartphones impulsionam a disponibilidade de dados na Web. Nesta extensa quantidade de dados, existe um tipo de dado específico conhecido como dado espacial. Este dado é a representação de um objeto físico a partir de coordenadas espaciais (e.g. latitude e longitude). Eles são críticos em um grande número de aplicações. Por exemplo, uma usuária pode ser avisada de uma emergência utilizando aplicativos baseados em dados espaciais. Estima-se que 80% de todos os aplicativos baseados em dados possuem dados geo-referenciados. Consultas espaciais são amplamente empregadas para manipular este tipo de dado eficientemente. Entretanto, o usuário tem um papel importante no processo de recuperação dos dados espaciais. Por décadas, pesquisadores propuseram técnicas para auxiliar usuários a expressar as suas necessidades. Dentre estas técnicas, pode-se citar os modelos booleanos, correspondência de padrões e expansão de consulta. Apesar da existência de alternativas importantes, faltam soluções aplicadas às consultas preferenciais por palavras-chave. O top-k Spatial Keyword Preference Query (SKPQ) surge como uma solução potencial para auxiliar usuários a encontrar pontos de interesse (POIs). O SKPQ seleciona POIs considerando a descrição de locais na vizinhança. Em essência, o usuário define uma restrição espacial (i.e. raio) e textual (i.e. palavras-chave) a ser satisfeita. Nesse contexto, esta tese propõe estratégias para melhorar a recuperação de informação proporcionada pela SKPQ e consultas similares. A contribuição desta tese pode ser dividida em três etapas. Na primeira, dois repositórios Linked Open Data (LOD) são explorados para melhorar a descrição dos POIs e suas vizinhanças. A descrição do POI no LOD contém mais informação do que nos bancos de dados espaciais tradicionais, o que leva a uma descrição mais detalhada. Na segunda etapa, os resultados da consulta são personalizados para apresentar os melhores POIs para o usuário nas primeiras posições do ranking. Ao explorar comentários relacionados aos POIs, o sistema identifica o objeto que melhor satisfaz o usuário da consulta e reordena o ranking de acordo com a preferência dele. Na terceira etapa, utilizamos uma função probabilística para descrever a preferência por POIs próximos um do outro. Esta função probabilística é incorporada à função de ranqueamento para que a busca também considere esta preferência. Por fim, avaliamos separadamente cada estratégia proposta nesta tese. A primeira estratégia alcançou melhora de 20% no NDCG ao utilizar palavras-chave aleatórias. Assim como encontrou POIs onde não era possível encontrar com a SKPQ. A segunda estratégia adiciona melhora de 92% no NDCG. Enquanto a terceira estratégia melhora a consistência do rank, alcançando aumento no coeficiente Tau de 52%.



MEMBROS DA BANCA:

Presidente - 2011187 - FREDERICO ARAUJO DURAO

Interno(a) - 1232218 - DANIELA BARREIRO CLARO

Interno(a) - 2049039 - VANINHA VIEIRA DOS SANTOS

Externo(a) à Instituição - CARLOS ANDRÉ GUIMARÃES FERRAZ - UFPE

Externo(a) à Instituição - CARLOS EDUARDO SANTOS PIRES - UFCG

Data da Defesa: 
03/05/2021 - 08:30
Tipo de Defesa: 
Defesa de Doutorado