ALGORITMO DE CLASIFICACIÓN MEDIANTE UN ENFOQUE DE MACHINE LEARNING Y SU APLICACIÓN AL ESTUDIO METEOROLÓGICO
La clasificación de datos propone una polaridad tanto en el algoritmo de árbol como en el teorema de las causas. Se necesaria hacer uso de conjuntos de datos, en este estudio son variables meteorológicas, para construir un modelo predictivo basado en entrenamiento. Los datos son almacenados y procesados haciendo uso de almacenes en grandes volúmenes de datos, estos proponen un sistema basado en entidades con independencia sustancial, de objetos de datos, a partir de una técnica llamada ciencia de datos o Data Science. Técnica que permite adquirir información de valor de los datos, en este caso equipos y sensores de IoT. Inicialmente se capturan en formato no procesado o Raw Data.
El objetivo del estudio es hacer uso de las plataformas tecnológicas disponibles para trabajar el pronóstico de datos de meteorología basados en algoritmos de ML (Machine Learning) y datos históricos para al altiplano central, costa del pacífico y valles de oriente de Guatemala. Los métodos utilizados son estadísticos embebidos en algoritmos de tipo predictivos, además de una matriz de confusión para evaluar los resultados obtenidos en el estudio de estas herramientas y recursos, con un enfoque cuantitativo e instrumentos de IoT, ML y Big Data. El tipo de estudio general es correlacional-predictivo-histórico del lado de la variable y comparativo-explicativo para el algoritmo. Las variables tienen una dimensión anual, mensual y diaria ente 2000 y 2018.
En conclusión, se logra el pronosticó del nivel de humedad para las muestras seleccionadas en base a las variables meteorológicas tomadas con dispositivos electrónicos y procesadas por medios informáticos entre dos algoritmos y un dieciocho por ciento de diferencia al comparar la eficiencia.
ALGORITMO DE CLASIFICACIÓN MEDIANTE UN ENFOQUE DE MACHINE LEARNING Y SU APLICACIÓN AL ESTUDIO METEOROLÓGICO
-
DOI: 10.22533/at.ed.3172172202082
-
Palavras-chave: Clasificación de datos, Internet de las Cosas, Industria 4.0, Modelo Supervisado.
-
Keywords: Data Classification, Internet of Things, Industry 4.0, Supervised Model.
-
Abstract:
Data classification is a polarity both in the tree algorithm and in the theorem of causes. It is necessary to do use of data sets, in this study they are meteorological variables, to build a predictive model based on training data. The data is stored and processed using big data warehouses, it’s a system based on entities with substantial independence from data objects, based on a technique of Data Science. Technique that allows acquiring valuable information from data, in this case IoT equipment and sensors. Initially they are captured in unprocessed format or Raw Data.
The objective of the study is to do use of the available technological platforms to work on the forecast of meteorology data based on Machine Learning Algorithms and historical data for the Central Highlands, Pacific Coast and Eastern Valleys of Guatemala. The methods used are statistics embedded in predictive algorithms, in addition to a confusion matrix to evaluate the results obtained in the study of these tools and resources, with a quantitative approach and IoT, Machine Learning and Big Data instruments. The type of general research is correlational-predictive-historical on the side of the variable and comparative-explanatory for the algorithm. The metrics of variables have an annual, monthly and daily dimension between 2000 and 2018.
In conclusion, the forecast of the humidity level for the selected samples is accomplished based on the meteorological variables taken with electronic devices and processed by computer between two algorithms and an eighteen percent difference when comparing the efficiency.
-
Número de páginas: 23
- Pedro Elizardo Donis del Cid