Utilização de Técnicas de Clusterização e Cadeias de Markov para Sistemas de Recomendação de Itens de Cauda Longa

DISCENTE Diogo Vinícius de Sousa Silva

DATA : 09/06/2022



HORA: 14:00



TÍTULO:

Utilização de Técnicas de Clusterização e Cadeias de Markov para Sistemas de Recomendação de Itens de Cauda Longa
 



RESUMO:

Sistemas de Recomendação focam em recomendar os mais relevantes itens para usuários finais. Geralmente, os itens mais importantes são também os mais populares. Entretanto, o surgimento de novas formas de distribuição de conteúdo nos mais diversos mercados implicou no surgimento do fenômeno cauda longa, ou seja, a formação de novos mercados com produtos de nicho. Considerando o crescimento de grupos relacionados a mercados de nicho, o estudo de recomendações na cauda longa tornou-se cada vez mais crescente. Todavia, por serem menos populares, itens de cauda longa possuem uma menor quantidade de feedbacks, informações que geralmente são fornecidas pelos usuários através de compras, avaliações ou classificação (ratings) de um item. Como o sistema se baseia nos dados de comportamento de utilização e/ou histórico de vendas, quanto menor a quantidade e variedade de dados disponíveis para serem analisados, mais difícil será gerar recomendações mais relevantes. O principal objetivo da proposta apresentada nesta tese é o desenvolvimento de um modelo de recomendação que consiga melhor direcionar os usuários a itens de nicho. Assim, conduzi-los a uma maior diversidade de produtos e ao mesmo tempo de grande relevância. Para isso, técnicas de clusterização e representação de matrizes através de grafos são exploradas. Propomos duas abordagens e adotamos para cada uma, duas técnicas da literatura aplicadas de forma híbrida. A primeira técnica adota cadeias de Markov para calcular similaridades dos nós de um grafo usuário-item. A segunda técnica aplica clusterização no conjunto de itens de um dataset. Experimentos foram realizados para avaliar a abordagem e medir a eficácia das recomendações considerando o contexto da cauda longa. Métricas como recall, diversidade e popularidade das recomendações geradas foram mensuradas e comparadas com técnicas cujo objetivos não abrangem diretamente recomendações cauda longa. Além disso, um questionário aplicado com especialistas do domínio do negócio também complementaram a avaliação das abordagens propostas. Comparando com outros trabalhos do estado da arte, os resultados mostram que é possível melhorar a precisão das recomendações mesmo focando em itens menos populares, no caso, produtos de nicho que formam a cauda longa. O recall em alguns casos melhorou cerca de 27,9% enquanto que a popularidade dos itens recomendados diminuiu. Além disso, as recomendações focaram em itens mais diversificados indicando melhor exploração dos itens de cauda longa.
 





MEMBROS DA BANCA:

Membro Externo 1: Renato de Freitas Bulcão Neto (UFG)
 
Membro Externo 2): Pedro de Alcântara dos Santos Neto (UFPI)
 
Membro Interno 1 ou Titular Externo 3: Rafael Augusto de Melo (PGCOMP/UFBA)
 
Membro Interno 2 ou Titular Externo 4: Maycon Leone Maciel Peixoto (DCC/UFBA)
 
Membro Suplente Externo 1: João Batista da Rocha Júnior (UEFS)
 
Membro Suplente Externo 2: Marcelo Garcia Manzato (ICMC/USP)
 
Membro Suplente Interno 1 ou Suplente Externo 3: Cássio Vinicius Serafim Prazeres (PGCOMP/UFBA)
 
Membro Suplente Interno 2 ou Suplente Externo 4: Daniela Barreiro Claro (PGCOMP/UFBA)
 
 
 
 
 
 
 
Data da Defesa: 
09/06/2022 - 14:00
Tipo de Defesa: 
Defesa de Doutorado