Por favor, use este identificador para citar o enlazar este ítem:
http://repositorio.udec.cl/jspui/handle/11594/400
Título : | Predicción de potenciales clientes de inmuebles para Aitué, basado en datos históricos de sus clientes |
Autor : | Cabrera Vives, Guillermo Felipe; supervisor de grado Cárdenas Liebethal, Joaquín Antonio |
Palabras clave : | Aitue - Bases de Datos;Bases de Datos;Usuarios de Bases de Datos;Minería de Datos;Análisis de Regresión Logística |
Fecha de publicación : | 2019 |
Editorial : | Universidad de Concepción. |
Resumen : | Para esta memoria de título se trabajó con la inmobiliaria Aitué. Se propuso como objetivo principal predecir la probabilidad de que un cotizante se convierta en cliente. Para lograr esto, se utilizaron datos de cotizaciones de 5 proyectos que actualmente están en venta. Se usó como marco de trabajo la metodología CRISP-DM. Aitué maneja una base de datos de personas que cotizan un inmueble y otra de quienes realizan negocios. A partir de estos datos se generó un nuevo dataset, que describe el comportamiento de las personas durante sus cotizaciones y su disposición a entregar datos personales. Además asignados etiquetas “negocio” y “compra”, como los atributos a predecir, los cuales representan el inicio de un proceso de venta y una venta finalizada respectivamente. Para el estudio se seleccionó el proyecto “San Andrés Del Valle”, el cual cuenta con la mayor cantidad de datos. Se abordaron 2 tareas, predecir un cliente para un cotizante nuevo y predecir un cliente en base su historial de cotizaciones. Para ambas tareas se utilizaron y compararon 5 técnicas de clasificación usadas en la literatura: Logistic Regression(LR), Decision Tree (DT), Random Forest (RF), XGBoost (XGB) y Support Vector Machine (SVM). Para elegir el mejor modelo se utilizó como métrica comparativa “el área bajo la curva” (AUC) del gráfico Receiver Operating Characteristics (ROC) y el puntaje f1-score, privilegiando el primero. En la tarea de predecir un cliente cuando es un nuevo cotizante (Tarea 1) y variable objetivo “negocio”, el mejor modelo fue XGB con un AUC de 0.827 y un f1_scorede 0.652 y la variable objetivo “compra” el modelo RF fue el mejor, con un AUC de 0.926 y f1-score de 0.492. En la tarea de predecir un cliente cuando es un cliente histórico (Tarea2) con variable objetivo “negocio”, fue LR con un AUC de 0.833 y un f1_score de 0.598 y para la variable objetivo ”compra” el modelo RF obtuvo el mejor puntaje con un AUC de 0.807 y f1-score de 0.304. Ningún modelo superó un Lift de 1.5. Además se destacan como los atributos más significativos para la tarea 1 son: si entrega la dirección, la fecha de nacimiento y el número de integrantes de la familia, mientras que en la tarea 2 fueron la cantidad de cotizaciones y si es "recontacto". Con el fin de utilizar los resultados de forma práctica, se realizó un prototipo de una aplicación web, el cual busca simular el actual sistema de ingreso de cotizantes y cotizaciones utilizado en la empresa, integrando los modelos aprendidos. |
Descripción : | Ingeniero Civil Informático Universidad de Concepción 2019 |
URI : | http://repositorio.udec.cl/jspui/handle/11594/400 |
metadata.dc.identifier.other: | 241382 |
Aparece en las colecciones: | Ingeniería Informática y Ciencias de la Computación - Tesis Pregrado |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
Tesis_Prediccion_de_potenciales_clientes.pdf | 3,8 MB | Adobe PDF | Visualizar/Abrir |
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons