Acelerando o Algoritmo k-Means - Principais Propostas
O objetivo do algoritmo k-Means é o de particionar um conjunto de instâncias de dados em k grupos (k clusters), sendo k um parâmetro usualmente fornecido pelo usuário. Apesar de eficiente na indução de um conjunto (clustering) de k grupos o k-Means padrão tem algumas deficiências e.g., quando o volume de instâncias de dados a ser processado é alto, o algoritmo pode ter um elevado custo computacional até o seu término. Esse artigo apresenta uma revisão de estratégias propostas na literatura para contornar algumas características do algoritmo com o objetivo de acelerar o seu processamento.
Acelerando o Algoritmo k-Means - Principais Propostas
-
DOI: 10.22533/at.ed.9332211043
-
Palavras-chave: aprendizado de máquina, agrupamentos, k-means, desigualdade trian-gular
-
Keywords: machine learning, clustering, k-means, triangular inequality
-
Abstract:
The goal of the k-Means algorithm is to partition a set of data instances into k clusters, where k is a parameter usually supplied by the user. Despite being efficient in inducing a set (clustering) of k clusters, the standard k-Means has some deficiencies, e.g., when the volume of data instances to be processed is high, the algorithm may have a high computational cost until its completion. This paper presents a review of strategies proposed in the literature to circumvent some characteristics of the algorithm with the objective of speeding up its processing.
-
Número de páginas: 10
- Maria do Carmo Nicoletti
- MARCELO KUCHAR MATTE