Identificação de Tipos de Relações Temporais Event-Time em Português: Uma Abordagem Baseada em Regras com Classificação Associativa

Nome do aluno

 

DÁRCIO SANTOS ROCHA

 

Título do trabalho

 

IDENTIFICAÇÃO DE TIPOS DE RELAÇÕES TEMPORAIS EVENT-TIME EM PORTUGUÊS: UMA ABORDAGEM BASEADA EM REGRAS COM CLASSIFICAÇÃO ASSOCIATIVA

 

Resumo do trabalho

 

Este trabalho tem como objetivo desenvolver um método computacional para identificar tipos de relações temporais entre eventos e expressões temporais em textos escritos em língua portuguesa. A fim de alcançar esse objetivo, serão empregadas técnicas de aprendizado de regras para descobrir as melhores combinações de informações linguísticas disponíveis, formulando regras de decisão que possam identificar eficientemente os tipos de relações temporais entre eventos e expressões temporais. A maioria dos trabalhos relacionados adotou uma abordagem baseada em aprendizagem de máquina, enquanto apenas um utilizou uma abordagem híbrida, combinando regras manuais. A metodologia proposta neste trabalho consiste em uma abordagem baseada em regras, que incorpora informações lexicais, morfossintáticas e contextuais, tempos verbais de Reichenbach, sinais temporais e conhecimento sobre o mundo, além das anotações TimeML no corpus. Ao contrário de uma abordagem puramente baseada em aprendizagem de máquina, os conjuntos de regras gerados pelo nosso método permitem a combinação de regras geradas pelos diferentes algoritmos, ou a combinação de conjuntos completos, o que pode resultar em melhor desempenho. Em resumo, o método recebe pares de evento/expressão temporal como entrada e utiliza uma estratégia de filtragem para selecionar os pares com maior probabilidade de terem sido anotados no corpus. Em seguida, aplica conjuntos de regras em cada par para identificar o tipo da relação temporal existente e uma estratégia de aumento de dados para calcular o fechamento temporal de todos os pares e suas respectivas relações identificadas. Em experimentos preliminares, propusemos um conjunto inicial de regras manuais para o idioma português. No entanto, os resultados obtidos demonstraram que esse conjunto era limitado, resultando em baixa cobertura e consequentemente baixa acurácia. O valor máximo alcançado foi de 45,1% de acurácia e 34,1% de cobertura nos dados de teste. Para melhorar esses resultados, propomos incorporar técnicas de aprendizagem de regras ao método, visando aumentar o conjunto de regras. Essas técnicas são capazes de lidar bem com dados contendo ruídos, funcionar bem em dados não vistos e gerar regras mais eficientes, além de oferecer desempenho competitivo e funcionar de forma eficiente. Com essa incorporação, esperamos que os experimentos propostos produzam um conjunto de regras capaz de identificar tipos de relações temporais event-time com eficiência e alcance resultados superiores. Isso contribuirá para o avanço do estado da arte na área, além de disseminar a pesquisa realizada e contribuir com a comunidade científica.

 

Orientador

 

Marlo Vieira dos Santos e Souza

 

Co-orientador

 

Daniela Barreiro Claro

 

Membro Titular Externo (com afiliação)

 

Rerisson Cavalcante de Araújo (UFBA)

 

Link para o curriculum lattes

 

http://lattes.cnpq.br/9546551094655305

 

Membro Titular Interno ou Titular Externo 2 (com afiliação)

 

Robespierre Dantas da Rocha Pita

 

Link para o curriculum lattes

 

http://lattes.cnpq.br/9031151666715654

 

Membro Suplente Externo (com afiliação)

 

Clarissa Castellã Xavier

 

Link para o curriculum lattes

 

http://lattes.cnpq.br/4559730979810612

 

Membro Suplente Interno ou Suplente Externo 2 (com afiliação)

 

Tatiane Nogueira Rios

 

Link para o curriculum lattes

 

http://lattes.cnpq.br/0851148137941240

 

Data da defesa

 

04 Aug, 2023

 

Horário da defesa

 

2:00 PM

 

 

Data da Defesa: 
04/08/2023 - 14:00
Tipo de Defesa: 
Defesa de Mestrado