Anotações Semânticas em Repositórios Acadêmicos: Um Estudo de Caso com o RI da UFBA

Banca de DEFESA: ALINE MEIRA ROCHA

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.

DISCENTE : ALINE MEIRA ROCHA

DATA : 03/03/2020

HORA: 10:00

LOCAL: STI

TÍTULO:

Anotações Semânticas em Repositórios Acadêmicos: um estudo de caso com o RI da UFBA



PALAVRAS-CHAVES:

anotação semântica

repositórios acadêmicos

aprendizado de máquina

classificação textual

extração de keywords



PÁGINAS: 103

RESUMO:

Repositórios Institucionais (RI) são repositórios acadêmicos que possibilitam o armazenamento e a divulgação das produções científicas de universidades e centros de pesquisa. Estes repositórios permitem o auto-arquivamento, onde o próprio pesquisador pode efetuar o depósito de sua publicação. As informações sobre cada item depositado são armazenadas em seus metadados, mas como usualmente isso é feito de maneira manual pelo próprio pesquisador nem sempre os termos escolhidos ajudam nessa descrição, o que leva à intervenção dos bibliotecários no processo. A sugestão de keywords durante a validação dos metadados certamente ajudaria os bibliotecários pois identificaria termos representativos de cada publicação e enriqueceria semanticamente esses metadados, favorecendo a recuperação dos itens em um RI. Já métodos de aprendizagem de máquina de classificação textual binária podem sugerir que uma publicação também seja associada a outra coleção caso seja identificado que se trata de trabalho multidisciplinar. Também é possível auxiliar na classificação de publicações ainda não depositadas no RI e que não estejam organizadas por coleção mas por outro critério, como por exemplo data de entrega ao colegiado ou data da defesa. Dessa forma baseado nos termos representativos de cada comunidade e sub-comunidade, é possível treinar um classificador multi-hierárquico para identificar a qual comunidade e sub-comunidade cada trabalho deve pertencer. Por outro lado, a anotação semântica de metadados referentes a coleções e keywords permite o enriquecimento das descrições de itens do RI, além de facilitar o processo de recuperação. Nesse contexto o objetivo deste trabalho é anotar semanticamente os itens de um repositório acadêmico no Dspace de maneira semi-automática utilizando o padrão RDF do Dublin Core a partir dos resultados obtidos na classificação textual e validação das sugestões de keywords. Adicionalmente foi realizado um estudo de caso no RI da UFBA, onde as keywords extraídas passaram pela validação de especialistas de domínio, no caso as bibliotecárias do SIBI (Sistema de Bibliotecas da UFBA). Com isso, foi realizada a anotação semântica dos resultados obtidos no experimento da classificação textual e no estudo de caso. As principais contribuições desse projeto dizem respeito ao estudo exploratório de métodos de validação e classificação de depósitos das publicações, além do método de descrição e enriquecimento semânticos dos itens de um RI.



MEMBROS DA BANCA:

Interno - 1232218 - DANIELA BARREIRO CLARO

Interno - 1678446 - LAIS DO NASCIMENTO SALVADOR

Externo ao Programa - 285862 - FLAVIA GOULART MOTA GARCIA ROSA

Data da Defesa: 
03/03/2020 - 10:00
Tipo de Defesa: 
Defesa de Mestrado