Identificação de Tipos de Relações Temporais Event-Time em Português: Uma Abordagem Baseada em Regras com Classificação Associativa

Nome do aluno
 
DÁRCIO SANTOS ROCHA
 
Título do trabalho
 
Identificação de Tipos de Relações Temporais Event-Time em Português: Uma Abordagem Baseada em Regras com Classificação Associativa
 
Resumo do trabalho
 
Este trabalho tem como objetivo desenvolver um método computacional para identificar tipos de relações temporais entre eventos e expressões temporais em textos escritos em língua portuguesa. A fim de alcançar esse objetivo, serão empregadas técnicas de aprendizado de regras para descobrir as melhores combinações de informações linguísticas disponíveis, formulando regras de decisão que possam identificar eficientemente os tipos de relações temporais entre eventos e expressões temporais. A maioria dos trabalhos relacionados adotou uma abordagem baseada em aprendizagem de máquina, enquanto apenas um utilizou uma abordagem híbrida, combinando regras manuais. A metodologia proposta neste trabalho consiste em uma abordagem baseada em regras, que incorpora informações lexicais, morfossintáticas e contextuais, tempos verbais de Reichenbach, sinais temporais e conhecimento sobre o mundo, além das anotações TimeML no corpus. Ao contrário de uma abordagem puramente baseada em aprendizagem de máquina, os conjuntos de regras gerados pelo nosso método permitem a combinação de regras geradas pelos diferentes algoritmos, ou a combinação de conjuntos completos, o que pode resultar em melhor desempenho. Em resumo, o método recebe pares de evento/expressão temporal como entrada e utiliza uma estratégia de filtragem para selecionar os pares com maior probabilidade de terem sido anotados no corpus. Em seguida, aplica conjuntos de regras em cada par para identificar o tipo da relação temporal existente e uma estratégia de aumento de dados para calcular o fechamento temporal de todos os pares e suas respectivas relações identificadas. Em experimentos preliminares, propusemos um conjunto inicial de regras manuais para o idioma português. No entanto, os resultados obtidos demonstraram que esse conjunto era limitado, resultando em baixa cobertura e consequentemente baixa acurácia. O valor máximo alcançado foi de 45,1\% de acurácia e 34,1\% de cobertura nos dados de teste. Para melhorar esses resultados, propomos incorporar técnicas de aprendizagem de regras ao método, visando aumentar o conjunto de regras. Essas técnicas são capazes de lidar bem com dados contendo ruídos, funcionar bem em dados não vistos e gerar regras mais eficientes, além de oferecer desempenho competitivo e funcionar de forma eficiente. Com essa incorporação, esperamos que os experimentos propostos produzam um conjunto de regras capaz de identificar tipos de relações temporais event-time com eficiência e alcance resultados superiores. Isso contribuirá para o avanço do estado da arte na área, além de disseminar a pesquisa realizada e contribuir com a comunidade científica.
 
Orientador
 
Marlo Vieira dos Santos e Souza
 
Co-orientador
 
Daniela Barrei Claro
 
Membro Titular 1
 
Robespierre Dantas da Rocha Pita
 
Link para o curriculum lattes
 
http://lattes.cnpq.br/9031151666715654
 
Membro Titular 2
 
Rerisson Cavalcante de Araújo
 
Link para o curriculum lattes
 
http://lattes.cnpq.br/9546551094655305
 
Suplente 1
 
Roberto Freitas Parente
 
Link para o curriculum lattes
 
http://lattes.cnpq.br/8377156505906585
 
Suplente 2
 
Clarissa Castellã Xavier
 
Link para o curriculum lattes
 
http://lattes.cnpq.br/4559730979810612
 
Data do exame
 
13 Apr, 2023
 
Horário do exame
 
9:00 AM
 

 

Data da Defesa: 
13/04/2023 - 09:00
Tipo de Defesa: 
Qualificação de Mestrado