PARALELIZAÇÃO DO PROBLEMA DE ORDENAÇÃO COM O USO DE OPENCL
A aplicação de técnicas de ordenação está presente em diversos problemas de engenharia de modo que podem ser responsáveis por grande parte do custo computacional. Desta forma, neste artigo realiza-se um estudo sobre a viabilidade de técnicas de processamento paralelo nos algoritmos de ordenação com o objetivo de redução do tempo. Para o desenvolvimento deste artigo implementam-se o método MergeSort em serial e em OpenCL, e os métodos Buble Sort Sorting Network e Bitonic MergeSort em OpenCL. Realizam-se as simulações utilizando a plataforma Google Colaboratory (Google Colab), onde foram acessadas duas máquinas com as placas gráficas Tesla T4 (2560 CUDA cores) e Tesla P100-PCIE-16GB (3584 CUDA cores). Verifica-se que somente a versão paralela Bitonic MergeSort proporcionou uma redução do tempo computacional em relação a versão serial. Comparando-se os tempos computacionais utilizando as placas gráficas, observa-se que o tempo computacional utilizando a Tesla P100 é menor que o utilizando a Tesla T4, isso se deve, principalmente, pela quantidade de CUDA cores disponíveis. Por apresentar 1000 CUDA cores a mais, a Tesla P100 consegue executar mais atividades ao mesmo tempo, o que gera uma redução do tempo computacional. De todo modo, a paralelização é importante de ser realizada em programas que demandam muito tempo computacional, entretanto, deve-se fazer um estudo do código, a fim de verificar se essa paralelização resultará em redução do tempo
PARALELIZAÇÃO DO PROBLEMA DE ORDENAÇÃO COM O USO DE OPENCL
-
DOI: 10.22533/at.ed.49621090314
-
Palavras-chave: Processamento paralelo; Algoritmos de ordenação; Google Colaboratory
-
Keywords: Parallel processing; Sorting algorithms; Google Colaboratory
-
Abstract:
The application of sorting techniques is present in several engineering problems so that they can be responsible for a large part of the computational cost. Thus, in this article, a study is carried out on the feasibility of parallel processing techniques in the sorting algorithms to reduce time. For the development of the article, the MergeSort method is implemented in serial and OpenCL, and the Buble Sorting Network and Bitonic MergeSort methods in OpenCL. The simulations are carried out using a Google Collaboratory platform (Google Colab), where two machines with the Tesla T4 graphics card (2560 CUDA cores) and Tesla P100-PCIE-16GB (3584 CUDA cores) were accessed. It appears that only the parallel version Bitonic MergeSort provided a reduction in computational time concerning the serial version. Comparing the computational times using graphics cards, it is observed that the computational time using a Tesla P100 is less than using a Tesla T4, this is mainly due to the amount of CUDA cores available. Because it has 1000 more CUDA cores, a Tesla P100 can perform more activities at the same time, which generates a reduction in computational time. Anyway, a parallelization is important to be performed in programs that demand a lot of computational time, however, a study of the code must be made, verify if this parallelization results in a reduction of time
-
Número de páginas: 15
- Heleno Pontes Bezerra Neto