Nome do aluno |
DÁRCIO SANTOS ROCHA |
Título do trabalho |
Identificação de Tipos de Relações Temporais Event-Time em Português: Uma Abordagem Baseada em Regras com Classificação Associativa |
Resumo do trabalho |
Este trabalho tem como objetivo desenvolver um método computacional para identificar tipos de relações temporais entre eventos e expressões temporais em textos escritos em língua portuguesa. A fim de alcançar esse objetivo, serão empregadas técnicas de aprendizado de regras para descobrir as melhores combinações de informações linguísticas disponíveis, formulando regras de decisão que possam identificar eficientemente os tipos de relações temporais entre eventos e expressões temporais. A maioria dos trabalhos relacionados adotou uma abordagem baseada em aprendizagem de máquina, enquanto apenas um utilizou uma abordagem híbrida, combinando regras manuais. A metodologia proposta neste trabalho consiste em uma abordagem baseada em regras, que incorpora informações lexicais, morfossintáticas e contextuais, tempos verbais de Reichenbach, sinais temporais e conhecimento sobre o mundo, além das anotações TimeML no corpus. Ao contrário de uma abordagem puramente baseada em aprendizagem de máquina, os conjuntos de regras gerados pelo nosso método permitem a combinação de regras geradas pelos diferentes algoritmos, ou a combinação de conjuntos completos, o que pode resultar em melhor desempenho. Em resumo, o método recebe pares de evento/expressão temporal como entrada e utiliza uma estratégia de filtragem para selecionar os pares com maior probabilidade de terem sido anotados no corpus. Em seguida, aplica conjuntos de regras em cada par para identificar o tipo da relação temporal existente e uma estratégia de aumento de dados para calcular o fechamento temporal de todos os pares e suas respectivas relações identificadas. Em experimentos preliminares, propusemos um conjunto inicial de regras manuais para o idioma português. No entanto, os resultados obtidos demonstraram que esse conjunto era limitado, resultando em baixa cobertura e consequentemente baixa acurácia. O valor máximo alcançado foi de 45,1\% de acurácia e 34,1\% de cobertura nos dados de teste. Para melhorar esses resultados, propomos incorporar técnicas de aprendizagem de regras ao método, visando aumentar o conjunto de regras. Essas técnicas são capazes de lidar bem com dados contendo ruídos, funcionar bem em dados não vistos e gerar regras mais eficientes, além de oferecer desempenho competitivo e funcionar de forma eficiente. Com essa incorporação, esperamos que os experimentos propostos produzam um conjunto de regras capaz de identificar tipos de relações temporais event-time com eficiência e alcance resultados superiores. Isso contribuirá para o avanço do estado da arte na área, além de disseminar a pesquisa realizada e contribuir com a comunidade científica. |
Orientador |
Marlo Vieira dos Santos e Souza |
Co-orientador |
Daniela Barrei Claro |
Membro Titular 1 |
Robespierre Dantas da Rocha Pita |
Link para o curriculum lattes |
http://lattes.cnpq.br/ |
Membro Titular 2 |
Rerisson Cavalcante de Araújo |
Link para o curriculum lattes |
http://lattes.cnpq.br/ |
Suplente 1 |
Roberto Freitas Parente |
Link para o curriculum lattes |
http://lattes.cnpq.br/ |
Suplente 2 |
Clarissa Castellã Xavier |
Link para o curriculum lattes |
http://lattes.cnpq.br/ |
Data do exame |
13 Apr, 2023 |
Horário do exame |
9:00 AM |
Data da Defesa:
13/04/2023 - 09:00
Tipo de Defesa:
Qualificação de Mestrado