Análise De Arquiteturas De Deep Learning Aplicado A Um Benchmark De Classificação
O Aprendizado Profundo (Deep
Learning) é uma subárea de Aprendizado de
Máquina (Machine Learning), que investiga
técnicas para simular o comportamento
do cérebro humano. No presente trabalho
apresenta-se uma análise de arquiteturas de
Deep Learning na solução de um problema de
Classificação. Para tanto, utilizou-se a base de
dados wine quality dataset (Cortez et al., 2009).
Foram analisadas 9 arquiteturas de Deep
Learning,com variações no número de neurônios
e camadas ocultas, de forma a comparar seus
desempenhos usando as métricas: Acurácia,
Precisão, Recall e F1 Score. Posteriormente foi
utilizado o teste de Kruskal-Wallis para avaliar
se há diferença estatisticamente significativa
entre as arquiteturas com a finalidade de
reduzir o custo computacional para futuras
aplicações. Verificou-se que a diferença entre
os desempenhos não é estatisticamente
significativa (com α = 5%) para nenhuma das
métricas utilizadas para este conjunto de dados,
sendo assim possível usar a arquitetura menos
complexa sem comprometer os resultados
obtidos, reduzindo o custo computacional.
Análise De Arquiteturas De Deep Learning Aplicado A Um Benchmark De Classificação
-
DOI: 10.22533/at.ed.2181911098
-
Palavras-chave: Deep Learning, Inteligência Artificial, Aprendizado Supervisionado, Redes Neurais
-
Keywords: Wine dataset, Deep Learning, artificial intelligence, metrics machine Learning and Kruskall Wallis
-
Abstract:
Deep Learning is a Machine
Learning subarea that investigates techniques
for simulating the behavior of the human brain.
In the present work we present an analysis of
architectures of Deep Learning in the solution of
a Classification problem. For this purpose, the
wine quality dataset database was used (Cortez
et al., 2009). We analyzed 9 architectures of
Deep Learning, with variations in the number of
neurons and hidden layers, in order to compare
their performances using the metrics: Accuracy,
Accuracy, Recall and F1 Score. Subsequently,
the Kruskal-Wallis test was used to evaluate if
there is a statistically significant difference between the architectures in order to reduce
the computational cost for future applications. It was verified that the difference between
the performances is not statistically significant (with a = 5%) for none of the metrics
used for this dataset, so it is possible to use the less complex architecture without
compromising the results obtained, reducing the computational cost.
-
Número de páginas: 15
- Max Tatsuhiko Mitsuya
- Clayton André Maia dos Santos
- Anderson Alvarenga de Moura Meneses
- Henrique Matheus Ferreira da Silva