Dificultad
intermediate
Duración promedio
2 hrs
Tecnologías
Data Science
Machine Learning
Logistic Regression
Dificultad
intermediate
Duración promedio
2 hrs
Tecnologías
Data Science
Machine Learning
Logistic Regression
Regístrate para obtener acceso a proyectos similares
Dificultad
intermediate
Duración promedio
2 hrs
Tecnologías
Data Science
Machine Learning
Logistic Regression
Dificultad
intermediate
Duración promedio
2 hrs
Tecnologías
Data Science
Machine Learning
Logistic Regression
Todas las semanas escogemos un proyecto de la vida real para que construyas tu portafolio y te prepares para conseguir un trabajo. Todos nuestros proyectos están construidos con ChatGPT como co-pilot!
Únete al retoUn podcast de cultura tecnológica donde aprenderás a luchar contra los enemigos que te bloquean en tu camino para convertirte en un profesional exitoso en tecnología.
Escuchar el podcastSigue las siguientes instrucciones:
Una vez que hayas terminado de resolver el caso práctico, asegúrate de confirmar tus cambios, haz push a tu repositorio y ve a 4Geeks.com para subir el enlace del repositorio.
Comprensión empresarial
Los depósitos a largo plazo permiten a los bancos retener dinero durante un período de tiempo específico, lo que permite al banco utilizar ese dinero para mejorar sus inversiones. Las campañas de marketing de este producto se basan en llamadas telefónicas. Si un usuario no se encuentra disponible en un momento dado, entonces se le volverá a llamar de nuevo en otro momento.
Descripción del problema
El banco portugués está teniendo una disminución en sus ingresos, por lo que quieren poder identificar a los clientes existentes que tienen una mayor probabilidad de contratar un depósito a largo plazo. Esto permitirá que el banco centre sus esfuerzos de marketing en esos clientes y evitará perder dinero y tiempo en clientes que probablemente no se suscribirán.
Para abordar este problema crearemos un algoritmo de clasificación que ayude a predecir si un cliente contrará o no un depósito a largo plazo.
El conjunto de datos se puede encontrar en esta carpeta de proyecto bajo el nombre bank-marketing-campaign-data.csv
. Puedes cargarlo en el código directamente desde el enlace (https://raw.githubusercontent.com/4GeeksAcademy/logistic-regression-project-tutorial/main/bank-marketing-campaign-data.csv
) o descargarlo y añadirlo a mano en tu repositorio. En este conjunto de datos encontrarás las siguientes variables:
age
. Edad del cliente (numérico)job
. Tipo de trabajo (categórico)marital
. Estado civil (categórico)education
. Nivel de educación (categórico)default
. ¿Tiene crédito actualmente? (categórico)housing
. ¿Tiene un préstamo de vivienda? (categórico)loan
. ¿Tiene un préstamo personal? (categórico)contact
. Tipo de comunicación de contacto (categórico)month
. Último mes en el que se le ha contactado (categórico)day_of_week
. Último día en el que se le ha contactado (categórico)duration
. Duración del contacto previo en segundos (numérico)campaign
. Número de contactos realizados durante esta campaña al cliente (numérico)pdays
. Número de días que transcurrieron desde la última campaña hasta que fue contactado (numérico)previous
. Número de contactos realizados durante la campaña anterior al cliente (numérico)poutcome
. Resultado de la campaña de marketing anterior (categórico)emp.var.rate
. Tasa de variación del empleo. Indicador trimestral (numérico)cons.price.idx
. Índice de precios al consumidor. Indicador mensual (numérico)cons.conf.idx
. Índice de confianza del consumidor. Indicador mensual (numérico)euribor3m
. Tasa EURIBOR 3 meses. Indicador diario (numérico)nr.employed
. Número de empleados. Indicador trimestral (numérico)y
. TARGET. El cliente contrata un depósito a largo plazo o no.Este segundo paso es vital para asegurar que nos quedamos con las variables estrictamente necesarias y eliminamos las que no son relevantes o no aportan información. Utiliza el Notebook de ejemplo que trabajamos y adáptalo a este caso de uso.
Asegúrate de dividir convenientemente el conjunto de datos en train
y test
como hemos visto en lecciones anteriores.
No es necesario que optimices los hiperparámetros. Comienza utilizando una definición por defecto y mejórala en el paso siguiente.
Después de entrenar el modelo, si los resultados no son satisfactorios, optimízalo empleando alguna de las técnicas vistas anteriormente.
NOTA: Solución: https://github.com/4GeeksAcademy/logistic-regression-project-tutorial/blob/main/solution.ipynb
Dificultad
intermediate
Duración promedio
2 hrs
Tecnologías
Data Science
Machine Learning
Logistic Regression
Dificultad
intermediate
Duración promedio
2 hrs
Tecnologías
Data Science
Machine Learning
Logistic Regression
Regístrate para obtener acceso a proyectos similares
Dificultad
intermediate
Duración promedio
2 hrs
Tecnologías
Data Science
Machine Learning
Logistic Regression
Dificultad
intermediate
Duración promedio
2 hrs
Tecnologías
Data Science
Machine Learning
Logistic Regression
Todas las semanas escogemos un proyecto de la vida real para que construyas tu portafolio y te prepares para conseguir un trabajo. Todos nuestros proyectos están construidos con ChatGPT como co-pilot!
Únete al retoUn podcast de cultura tecnológica donde aprenderás a luchar contra los enemigos que te bloquean en tu camino para convertirte en un profesional exitoso en tecnología.
Escuchar el podcast