Banca de DEFESA: ALINE MEIRA ROCHA
Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : ALINE MEIRA ROCHA
DATA : 03/03/2020
HORA: 10:00
LOCAL: STI
TÍTULO:
Anotações Semânticas em Repositórios Acadêmicos: um estudo de caso com o RI da UFBA
PALAVRAS-CHAVES:
anotação semântica
repositórios acadêmicos
aprendizado de máquina
classificação textual
extração de keywords
PÁGINAS: 103
RESUMO:
Repositórios Institucionais (RI) são repositórios acadêmicos que possibilitam o armazenamento e a divulgação das produções científicas de universidades e centros de pesquisa. Estes repositórios permitem o auto-arquivamento, onde o próprio pesquisador pode efetuar o depósito de sua publicação. As informações sobre cada item depositado são armazenadas em seus metadados, mas como usualmente isso é feito de maneira manual pelo próprio pesquisador nem sempre os termos escolhidos ajudam nessa descrição, o que leva à intervenção dos bibliotecários no processo. A sugestão de keywords durante a validação dos metadados certamente ajudaria os bibliotecários pois identificaria termos representativos de cada publicação e enriqueceria semanticamente esses metadados, favorecendo a recuperação dos itens em um RI. Já métodos de aprendizagem de máquina de classificação textual binária podem sugerir que uma publicação também seja associada a outra coleção caso seja identificado que se trata de trabalho multidisciplinar. Também é possível auxiliar na classificação de publicações ainda não depositadas no RI e que não estejam organizadas por coleção mas por outro critério, como por exemplo data de entrega ao colegiado ou data da defesa. Dessa forma baseado nos termos representativos de cada comunidade e sub-comunidade, é possível treinar um classificador multi-hierárquico para identificar a qual comunidade e sub-comunidade cada trabalho deve pertencer. Por outro lado, a anotação semântica de metadados referentes a coleções e keywords permite o enriquecimento das descrições de itens do RI, além de facilitar o processo de recuperação. Nesse contexto o objetivo deste trabalho é anotar semanticamente os itens de um repositório acadêmico no Dspace de maneira semi-automática utilizando o padrão RDF do Dublin Core a partir dos resultados obtidos na classificação textual e validação das sugestões de keywords. Adicionalmente foi realizado um estudo de caso no RI da UFBA, onde as keywords extraídas passaram pela validação de especialistas de domínio, no caso as bibliotecárias do SIBI (Sistema de Bibliotecas da UFBA). Com isso, foi realizada a anotação semântica dos resultados obtidos no experimento da classificação textual e no estudo de caso. As principais contribuições desse projeto dizem respeito ao estudo exploratório de métodos de validação e classificação de depósitos das publicações, além do método de descrição e enriquecimento semânticos dos itens de um RI.
MEMBROS DA BANCA:
Interno - 1232218 - DANIELA BARREIRO CLARO
Interno - 1678446 - LAIS DO NASCIMENTO SALVADOR
Externo ao Programa - 285862 - FLAVIA GOULART MOTA GARCIA ROSA