Comitês de agrupamentos bidimensionais de dados gerados via algorimos bio-inspirados multimodais [Digital]
Dissertação
Português
681.3.06:510.5
Fortaleza, 2011.
A área de Mineração de Dados (MD) fornece um conjunto de tarefas e algoritmos voltados à extração de informações de grandes bases de dados. Entre essas tarefas, temos o agrupamento bidimensional de dados (biclustering), em que linhas e colunas de uma matriz são agrupadas simultaneamente com base na...
Ver mais
A área de Mineração de Dados (MD) fornece um conjunto de tarefas e algoritmos voltados à extração de informações de grandes bases de dados. Entre essas tarefas, temos o agrupamento bidimensional de dados (biclustering), em que linhas e colunas de uma matriz são agrupadas simultaneamente com base na similaridade dos seus elementos. Os objetivos deste trabalho são realizar um estudo comparativo sistemático entre algoritmos bio-inspirados multimodais aplicados à tarefa de agrupamento bidimensional de dados e investigar o desempenho de comitês de biclusters gerados por esses algoritmos, tomando como base problemas de Bioinformática. Após se introduzir conceitos gerais de MD e específicos da tarefa de biclustering, passa-se a discorrer sobre algoritmos bio-inspirados multimodais e sobre modelos de comitês aplicados a essa tarefa. Experimentos conduzidos de forma sistemática avaliam o desempenho dos algoritmos bio-inspirados e de dois arranjos de comitês de biclusters, sendo que os resultados obtidos indicam que, em geral, os comitês obtiveram um desempenho mais satisfatório que os algoritmos multimodais, de acordo com as métricas de avaliação levantadas e testes estatísticos.
Palavras-Chave: Mineração de dados, Aprendizado de máquina, Agrupamento bidimensional, Comitês de máquinas, Meta-heurísticas, Algoritmos bio-inspirados, Bioinformática
Ver menos
Palavras-Chave: Mineração de dados, Aprendizado de máquina, Agrupamento bidimensional, Comitês de máquinas, Meta-heurísticas, Algoritmos bio-inspirados, Bioinformática
Ver menos
The goal of Data Mining (DM) as a research area is to provide a set of tasks and algorithms aiming at extracting interesting and useful information from large databases. Among several DM tasks lies that of biclustering, whereby rows and columns of a data matrix are simultaneously grouped based on...
Ver mais
The goal of Data Mining (DM) as a research area is to provide a set of tasks and algorithms aiming at extracting interesting and useful information from large databases. Among several DM tasks lies that of biclustering, whereby rows and columns of a data matrix are simultaneously grouped based on the similarity of their elements. The main objectives of this work are to provide a thorough comparative assessment on the performance of several multimodal bio-inspired algorithms while coping with biclustering as well as to investigate the potentials of ensemble models induced over biclusters generated by these algorithms, having in mind Bioinformatics problems. After introducing general DM concepts as well as specific concepts related to biclustering, a detailed characterization of the multimodal bio-inspired algorithms and ensemble models investigated here is provided. Experiments have been systematically conducted to evaluate the performance of these algorithms, and the overall results achieved indicate that the ensemble models can usually outperform the multimodal bio-inspired algorithms when applied alone, as evidenced by several efficiency and effectiveness measures and hypothesis tests.
Keywords: Data mining, Machine learning, Biclustering, Committee machines, Metaheuristics, Bio-inspired algorithms, Bioinformatics. Ver menos
Keywords: Data mining, Machine learning, Biclustering, Committee machines, Metaheuristics, Bio-inspired algorithms, Bioinformatics. Ver menos
Disponibilidade forma física: Existe obra de impressa de código : 88087
Menezes, Lara Carvalho
Autor
Coelho, Andre Luis Vasconcelos
Orientador
Coelho, Andre Luis Vasconcelos
Banca examinadora
Von Zuben, Fernando Jose
Banca examinadora
Farias, Pedro Porfírio Muniz
Banca examinadora
Pinheiro, Plácido Rogério
Banca examinadora
Universidade de Fortaleza. Programa de Pós-Graduação em Informática Aplicada
Dissertação (mestrado)