Artigo - Atena Editora

Artigo

Baixe agora

Livros

Big Data as a research proposal applied to Data Quality for the correct Government of an ICT Ecosystem

El término “dato” deriva del latín DATUM y su significado es lo que se da en el sentido de lo que acontece. Big Data es la terminología utilizada para designar a grandes volúmenes de datos que se generan con una determinada velocidad en la generación de la información y variedad en el formato en que se guarda.

El objeto del artículo es determinar los factores que definen la calidad global de la información en términos de variables de unidades de información por medio del marcaje según las tipologías de los errores presentados en la metodología de esta investigación.

Se concluye que para efectos de un adecuado gobierno del dato es necesario considerar los pequeños errores en las fuentes de datos para que los datos puedan ser utilizados por la industria en diferentes aplicaciones a través de los profesionales capacitados para el efecto. Siendo la hipótesis de la investigación válida donde, existe la siguiente relación proporcional: cuando el valor tiende a 1 existe alta calidad de la información y cuando tiende a 0 existe baja calidad, según las observaciones realizadas, siendo esta una relación directamente proporcional, entre las variables medibles y la categórica de calidad.

Ler mais

Big Data as a research proposal applied to Data Quality for the correct Government of an ICT Ecosystem

  • DOI: 10.22533/at.ed.216332301024

  • Palavras-chave: Big Data, Hadoop, MapReduce, NoSQL, Análisis y modelado de datos.

  • Keywords: Big Data, Hadoop, MapReduce, NoSQL, Data analysis and modeling.

  • Abstract:

    The term "data" derives from the Latin DATUM and its meaning is what is given in the sense of what happens. Big Data is the terminology used to designate large volumes of data that are generated with a certain speed in the generation of information and variety in the format in which it is stored.

    The object of the article is to determine the factors that define the global quality of the information in terms of variables of information units by means of marking according to the typologies of errors presented in the methodology of this research.

    It is concluded that for the purposes of adequate data governance, it is necessary to consider small errors in the data sources so that the data can be used by the industry in different applications through professionals trained for this purpose. Being the valid research hypothesis where, there is the following proportional relationship: when the value tends to 1 there is high quality of the information and when it tends to 0 there is low quality, according to the observations made, this being a directly proportional relationship between the measurable variables and the categorical quality.

  • Pedro Elizardo Donis del Cid
Fale conosco Whatsapp