Fuzzy optimum-path forest: a novel method for supervised classification [Digital]
Tese
Português
621.3.03
Fortaleza, 2022.
Nas últimas décadas, a lógica fuzzy desempenhou um papel essencial em muitas áreas de
pesquisa. Paralelamente, o reconhecimento de padrões baseado em grafos tem se mostrado de
grande importância devido à sua flexibilidade em particionar o espaço de recursos usando o
plano de fundo da teoria dos... Ver mais Nas últimas décadas, a lógica fuzzy desempenhou um papel essencial em muitas áreas de
pesquisa. Paralelamente, o reconhecimento de padrões baseado em grafos tem se mostrado de
grande importância devido à sua flexibilidade em particionar o espaço de recursos usando o
plano de fundo da teoria dos grafos. Há alguns anos, um novo framework para aprendizado
supervisionado, semi-supervisionado e não supervisionado denominado Floresta de Caminhos
Ótimos (OPF) foi proposto com resultados competitivos em diversas aplicações, além de possuir
uma baixa carga computacional. Nesta tese, propomos o método Floresta de Caminhos Ótimos
Difuso, uma versão aprimorada do classificador OPF que aprende a associação das amostras
de uma forma não supervisionada, que são posteriormente incorporados durante o treinamento
supervisionado. Essas informações são utilizadas para identificar as amostras de treinamento
mais relevantes, melhorando assim a etapa de classificação. Experimentos conduzidos em doze
conjuntos de dados públicos destacam a robustez da abordagem proposta, que se comporta de
forma semelhante ao OPF padrão nos piores cenários. Além disso, a proposta apresenta também
a aplicação do novo método Floresta de Caminhos Ótimos Difuso em um conjunto de dados de
pacientes de parkinson composto de recursos extraídos de imagens desenhadas à mão usando a
conhecida Máquina de Boltzmann Restrita comparam o método proposto com três abordagens
de linha de base, ou seja, as Máquinas de vetores de suporte, Naive Bayes e o classificador OPF
padrão. Por fim, os resultados superaram como linhas de base na maioria dos casos, apresentando
o Fuzzy OPF como uma alternativa viável para lidar com problemas de detecção de DP, sendo
clinicamente mais relevante para o diagnóstico de DP devido à sua precisão [90,62%] ser mais
significativa que as demais.
Palavras-chave: Floresta de Caminhos Ótimos, Classificadores, Aprendizado de máquina,
Lógica Difusa, Reconhecimento de padrões. Ver menos
pesquisa. Paralelamente, o reconhecimento de padrões baseado em grafos tem se mostrado de
grande importância devido à sua flexibilidade em particionar o espaço de recursos usando o
plano de fundo da teoria dos... Ver mais Nas últimas décadas, a lógica fuzzy desempenhou um papel essencial em muitas áreas de
pesquisa. Paralelamente, o reconhecimento de padrões baseado em grafos tem se mostrado de
grande importância devido à sua flexibilidade em particionar o espaço de recursos usando o
plano de fundo da teoria dos grafos. Há alguns anos, um novo framework para aprendizado
supervisionado, semi-supervisionado e não supervisionado denominado Floresta de Caminhos
Ótimos (OPF) foi proposto com resultados competitivos em diversas aplicações, além de possuir
uma baixa carga computacional. Nesta tese, propomos o método Floresta de Caminhos Ótimos
Difuso, uma versão aprimorada do classificador OPF que aprende a associação das amostras
de uma forma não supervisionada, que são posteriormente incorporados durante o treinamento
supervisionado. Essas informações são utilizadas para identificar as amostras de treinamento
mais relevantes, melhorando assim a etapa de classificação. Experimentos conduzidos em doze
conjuntos de dados públicos destacam a robustez da abordagem proposta, que se comporta de
forma semelhante ao OPF padrão nos piores cenários. Além disso, a proposta apresenta também
a aplicação do novo método Floresta de Caminhos Ótimos Difuso em um conjunto de dados de
pacientes de parkinson composto de recursos extraídos de imagens desenhadas à mão usando a
conhecida Máquina de Boltzmann Restrita comparam o método proposto com três abordagens
de linha de base, ou seja, as Máquinas de vetores de suporte, Naive Bayes e o classificador OPF
padrão. Por fim, os resultados superaram como linhas de base na maioria dos casos, apresentando
o Fuzzy OPF como uma alternativa viável para lidar com problemas de detecção de DP, sendo
clinicamente mais relevante para o diagnóstico de DP devido à sua precisão [90,62%] ser mais
significativa que as demais.
Palavras-chave: Floresta de Caminhos Ótimos, Classificadores, Aprendizado de máquina,
Lógica Difusa, Reconhecimento de padrões. Ver menos
In the past decades, fuzzy logic has played an essential role in many research areas. Alongside,
graph-based pattern recognition has shown to be of great importance due to its flexibility in
partitioning the feature space using the background from graph theory. Some years ago, a
new framework for... Ver mais In the past decades, fuzzy logic has played an essential role in many research areas. Alongside,
graph-based pattern recognition has shown to be of great importance due to its flexibility in
partitioning the feature space using the background from graph theory. Some years ago, a
new framework for supervised, semi-supervised, and unsupervised learning named Optimum-
Path Forest (OPF) was proposed with competitive processing time and predictive power in
several applications, besides its low computational costs. In this thesis, we propose the Fuzzy
Optimum-Path Forest, an improved version of the standard OPF classifier that learns the samples¿
membership through an unsupervised method, which is further incorporated during supervised
training. The proposed approach is used to identify the most relevant training samples, thus
improving the classification step. The experiments are conducted over twelve public datasets
highlighting the robustness of the method, which behaves similarly to the standard OPF. In
addition, the proposal also presents the application of the new Fuzzy Optimal Path Forest method
in a parkinson patient dataset composed of features extracted from hand-drawn images using the
well-known Restricted Boltzmann Machine compare the proposed method with three different
approaches. baseline, namely the Support Vector Machines, Naive Bayes, and the standard OPF
classifier. Finally, the results outperformed as baselines in most cases, presenting the Fuzzy OPF
as a viable alternative to deal with PD detection problems, being clinically more relevant for PD
diagnosis due to its accuracy [90.62%] be more significant than the others.
Keywords: Optimum-path forest, Classifiers, Fuzzy logic, Pattern recognition. Ver menos
graph-based pattern recognition has shown to be of great importance due to its flexibility in
partitioning the feature space using the background from graph theory. Some years ago, a
new framework for... Ver mais In the past decades, fuzzy logic has played an essential role in many research areas. Alongside,
graph-based pattern recognition has shown to be of great importance due to its flexibility in
partitioning the feature space using the background from graph theory. Some years ago, a
new framework for supervised, semi-supervised, and unsupervised learning named Optimum-
Path Forest (OPF) was proposed with competitive processing time and predictive power in
several applications, besides its low computational costs. In this thesis, we propose the Fuzzy
Optimum-Path Forest, an improved version of the standard OPF classifier that learns the samples¿
membership through an unsupervised method, which is further incorporated during supervised
training. The proposed approach is used to identify the most relevant training samples, thus
improving the classification step. The experiments are conducted over twelve public datasets
highlighting the robustness of the method, which behaves similarly to the standard OPF. In
addition, the proposal also presents the application of the new Fuzzy Optimal Path Forest method
in a parkinson patient dataset composed of features extracted from hand-drawn images using the
well-known Restricted Boltzmann Machine compare the proposed method with three different
approaches. baseline, namely the Support Vector Machines, Naive Bayes, and the standard OPF
classifier. Finally, the results outperformed as baselines in most cases, presenting the Fuzzy OPF
as a viable alternative to deal with PD detection problems, being clinically more relevant for PD
diagnosis due to its accuracy [90.62%] be more significant than the others.
Keywords: Optimum-path forest, Classifiers, Fuzzy logic, Pattern recognition. Ver menos
Pinheiro, Plácido Rogério
Orientador
Passos Júnior, Leandro Aparecido
Coorientador
Holanda Filho, Raimir
Banca examinadora
Viana, Gerardo Valdisio Rodrigues
Banca examinadora
Duarte, João Batista Furlan
Banca examinadora
Rabêlo, Ricardo de Andrade Lira
Banca examinadora