Este proyecto aborda el desafío de predecir la aprobación de préstamos bancarios utilizando técnicas avanzadas de análisis de datos y machine learning. El objetivo es desarrollar un modelo predictivo que pueda evaluar la probabilidad de aprobación de un préstamo basándose en una serie de características financieras y personales del solicitante.
La necesidad de automatizar y mejorar las decisiones de aprobación de préstamos ha llevado a la creación de este proyecto, que utiliza un conjunto de datos compuesto por varias características de los solicitantes de préstamos. A través de un enfoque metodológico riguroso que incluye análisis exploratorio de datos (EDA), ingeniería de características, y la implementación de varios modelos de clasificación, este proyecto busca optimizar el proceso de toma de decisiones en el ámbito financiero.
El enfoque adoptado comienza con un análisis exploratorio para identificar patrones y relaciones clave. La ingeniería de características mejora la relevancia de los datos para los modelos de machine learning. Se experimentó con varios algoritmos, como la regresión logística y los bosques aleatorios, evaluando su rendimiento mediante métricas como precisión y recall.
El modelo final demostró alta precisión en la predicción de aprobaciones de préstamos, subrayando la viabilidad de aplicar este modelo en entornos reales para agilizar y mejorar las decisiones de préstamo. Los resultados también proporcionan insights sobre los factores más influyentes en la aprobación de préstamos, ofreciendo a las instituciones financieras una base para ajustar sus criterios de evaluación.
Loan predict.ipynb
: Cuaderno Jupyter con el análisis, modelos predictivos y evaluaciones.test_Y3wMUE5_7gLdaTN.csv
: Conjunto de datos de prueba.train_u6lujuX_CVtuZ9i.csv
: Conjunto de datos de entrenamiento.
- Instalación de Dependencias: Asegúrate de tener todas las dependencias necesarias instaladas.
- Explora el Análisis: Revisa el EDA y la ingeniería de características para entender el proceso de análisis.
- Modelado y Evaluación: Examina la construcción y evaluación de los modelos de machine learning.
- Testeo: Utiliza el conjunto de datos de prueba para evaluar el rendimiento del modelo.
Python 3.x
Pandas
NumPy
Scikit-learn
Matplotlib