Artigo - Atena Editora

Artigo

Baixe agora

Livros

MODELADO PREDICTIVO DEL SCORE CREDITICIO PARA CLIENTES NO BANCARIZADOS: UNA APLICACIÓN DE CATBOOST

Este trabajo presenta el diseño y la evaluación de un modelo de Score de admisión para tarjetas de crédito dirigido a clientes No Hit, es decir, personas sin historial en el sistema financiero formal. El modelo busca predecir el riesgo crediticio clasificando a los solicitantes como “buenos” o “malos”, según su probabilidad de presentar un incumplimiento mayor a 60 días en los 12 meses posteriores a la emisión del crédito. Para su desarrollo, se empleó el algoritmo CatBoost, con implementación en Python. El proceso incluyó un preprocesamiento exhaustivo de datos, que abarcó la imputación de valores faltantes y el tratamiento de variables categóricas. El modelo fue entrenado con 54 337 registros y validado con 17 940. Los resultados evidencian un desempeño competitivo, con métricas como el coeficiente GINI (45.14 % en entrenamiento y 42.84 % en validación), AUC y KS. Además, la tabla de eficiencia muestra una relación inversa entre el score y la tasa de incumplimiento. La interpretación del modelo se realizó mediante valores SHAP, lo que permitió identificar las variables más influyentes de forma transparente. En conjunto, esta propuesta contribuye a la inclusión financiera responsable, facilitando la evaluación del riesgo en poblaciones tradicionalmente desatendidas.
Ler mais

MODELADO PREDICTIVO DEL SCORE CREDITICIO PARA CLIENTES NO BANCARIZADOS: UNA APLICACIÓN DE CATBOOST

  • DOI: https://doi.org/10.22533/at.ed.128112517036

  • Palavras-chave: Score crediticio, CatBoost, variables categóricas, riesgo de default, SHAP values.

  • Keywords: Credit score, CatBoost, categorical variables, default risk, SHAP values

  • Abstract: : This work presents the design and evaluation of a credit admission scoring model for “No Hit” clients, that is, individuals without a formal credit history in the financial system. The model aims to predict credit risk by classifying applicants as “good” or “bad” based on the probability of a payment default exceeding 60 days within 12 months after credit issuance. The model was developed using the CatBoost algorithm, implemented in Python. The process involved extensive data preprocessing, including the imputation of missing values and the treatment of categorical variables. It was trained on 54,337 records and validated with 17,940. The results demonstrate competitive performance, with metrics such as the GINI coefficient (45.14% in training and 42.84% in validation), AUC, and KS. Additionally, the efficiency table shows an inverse relationship between the score and the default rate. Model interpretability was achieved using SHAP values, allowing for transparent identification of the most influential variables.  Overall, this approach contributes to responsible financial inclusion by enabling credit risk assessment in traditionally underserved populations.

  • Carlos Alberto Peña Miranda
  • Jesús Adalberto Zelaya Contreras
  • Elizabeth Cosi Cruz
Fale conosco Whatsapp