Seleção de Características por Algoritmo Genético na Classificação da Cardiopatia Chagásica
Este artigo investiga o uso de
algoritmo genético na seleção de características
para predição de risco de morte de pacientes
com doença de Chagas. Um total de 19
características, divididas entre características
clínicas, tempo-frequenciais e de dinâmica
simbólica foram extraídas a partir de janelas
de 5 min das séries de intervalos RR do
eletrocardiograma de 150 pacientes. Os dados
foram utilizados para distinguir os grupos de
pacientes que evoluíram ou não para o óbito, por
meio de um modelo construído com máquina de
vetores de suporte (SVM) com kernel Gaussiano
(RBF - Radial Basis Function). A seleção
de características foi feita por um algoritmo
genético que avalia uma população de soluções
candidatas ao longo de 100 gerações, realizando
uma seleção de pais para um cruzamento
das soluções, gerando descendentes e
selecionando as candidatas com melhor taxa
de acerto a cada geração. Foram realizados
diferentes experimentos variando a quantidade
de dados utilizados para treinamento e teste do
classificador. Foi possível obter taxas de acerto
de 99,53%, 98,86% e 98,80% com 8, 9 e 10
características selecionadas, respectivamente.
Estes resultados foram superiores aos obtidos
com a seleção empírica realizada em trabalho
anterior, o que sugere que a técnica de algoritmo
genético pode melhorar o desempenho do
classificador de risco de morte de origem
cardíaca em pacientes chagásicos
Seleção de Características por Algoritmo Genético na Classificação da Cardiopatia Chagásica
-
DOI: 10.22533/at.ed.3771916016
-
Palavras-chave: Algoritmos Genéticos, Seleção de Características, Máquina de Vetores de Suporte, Classificação, Doença de Chagas.
-
Keywords: Genetic Algorithm, Features Selection, Support Vector Machine, Classification, Chagas Disease.
-
Abstract:
This paper investigates the use
of genetic algorithm for features selection in
predicting death in patients with Chagas disease.
A total of 19 features, among clinical data,
indices from time and frequency domain, and
symbolic dynamics features were extracted from
5-min epochs from RR series of 150 patients.
The data was used to distinguish the group of
patients who died and the group who did not
die, by using a model built with support vector
machine (SVM) with radial basis function (RBF)
kernel. The features selection was made by a
genetic algorithm that evaluates a population
of candidate solutions over 100 generations, doing selection of parents to do crossover and breed offspring, then selecting the
best solutions, with the highest accurate rate. Different experiments were performed
changing the amount of data used to train and test the classifier. There were achieved
accurate rates of 99.53%, 98.86% and 98.80% with 8, 9 and 10 features, respectively.
These results suggest that characteristics selection by genetic algorithms may improve
the performance of the classifier in predicting death of patients with Chagas disease.
-
Número de páginas: 15
- Lucas de Souza Rodrigues