Sistemas de dados auto-ajustáveis para a integração de Big Data: uma avaliação de componentes aprimorados por machine learning em tarefas de geocodificação

Nome do aluno

 

GUILHERME WALDSCHMIDT PEREIRA

 

Título do trabalho

 

Sistemas de dados auto-ajustáveis para a integração de Big Data: uma avaliação de componentes aprimorados por machine learning em tarefas de geocodificação

 

Resumo do trabalho

 

Sistemas de dados autoajustáveis são caracterizados por utilizar machine learning em seus componentes para otimizar e automatizar suas rotinas. O uso de redes neurais simples ou modelos tradicionais para estimar a distribuição dos dados e o workload de transações favorece a criação de melhores estruturas de índice, layouts de armazenamento, aprimoramento de consultas etc. capazes de superar soluções tradicionais. Outra vantagem trazida por esta nova geração de gerenciadores de bancos de dados, que concatena diversos destes componentes inteligentes, é a redução da necessidade de intervenção humana em atividades de tuning e configuração. Este trabalho objetiva avaliar a aplicabilidade destes sistemas em tarefas record linkage em grandes volumes de dados, especificamente em rotinas de geocodificação. As stored procedures implementadas para mimetizar um pipeline de integração de dados de saúde foram avaliadas quando ao seu desempenho, uso de recursos e acurácia. Os resultados preliminares indicam que a utilização de IODS pode melhorar a precisão da classificação dos endereços em seus respectivos setores censitários, reduzir o tempo de processamento em comparação a métodos amplamente utilizados na literatura.

 

Orientador

 

Robespierre Dantas da Rocha Pita

 

Membro Titular 1

 

Ronaldo dos Santos Mello

 

Link para o curriculum lattes

 

http://lattes.cnpq.br/5011370918857999

 

Membro Titular 2

 

Daniela Barreiro Claro; Islame Felipe da Costa Fernandes

 

Link para o curriculum lattes

 

http://lattes.cnpq.br/9217378047217370; http://lattes.cnpq.br/0058216016593116

 

Suplente 1

 

Daniele Montenegro da Silva Barros

 

Link para o curriculum lattes

 

http://lattes.cnpq.br/7753316780095100

 

Suplente 2

 

Frederico Araújo Durão

 

Link para o curriculum lattes

 

http://lattes.cnpq.br/6271096128174325

 

Data do exame

 

27 Aug, 2024

 

Horário do exame

 

10:00 AM

 

 

Data da Defesa: 
27/08/2024 - 10:00
Tipo de Defesa: 
Qualificação de Mestrado