Uma aplicação de random survival forests na avaliação de dados de falha de bombas centrífugas submersas
A análise de dados de tempo até um evento é um campo bem desenvolvido na área de estatística, onde o uso de métodos não paramétricos, semi-paramétricos e paramétricos tem sido muito desenvolvido e aplicado. O uso de métodos baseados em árvores, que pode ser enquadrado no contexto do aprendizado estatístico ou de máquina, foi desenvolvido paralelamente, tendo sido usado inicialmente em problemas de regressão e classificação, posteriormente em análise de sobrevivência (survival trees). Neste estudo inicialmente é ajustada uma survival tree, que permite maior interpretabilidade, mas que geralmente não gera boas previsões, posteriormente são usadas as random survival forests buscando aprimorar a acurácia das previsões. Finalmente a acurácia de previsão destas últimas é comparada com os modelos de Cox (semi-paramétrico) e um modelo de tempo de falha acelerado usando o escore de Brier.
Uma aplicação de random survival forests na avaliação de dados de falha de bombas centrífugas submersas
-
DOI: 10.22533/at.ed.4492229067
-
Palavras-chave: Random survival forests, bombas centrifugas submersas, poços marítimos.
-
Keywords: Random survival forests, electrical submersible pumps, ofsshore wells.
-
Abstract:
The analysis of time to event data is a well-developed field in statistics, where the use of nonparametric, semi-parametric and parametric methods has been widely developed and applied. The use of tree-based methods, which can be framed in the context of statistical or machine learning, was developed in parallel, having been initially used in regression and classification problems, later in survival trees. In this study initially a survival tree is adjusted, which allows greater interpretability, but that generally does not generate good predictions, later a random survival forests are used to improve the accuracy of predictions. Finally, the accuracy of prediction of the latter is compared with Cox model and an accelerated failure time model using the Brier score.
-
Número de páginas: 15
- Rafael de Olivaes Valle dos Santos
- Ricardo de Melo e Silva Accioly