Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.udec.cl/jspui/handle/11594/400
Título : Predicción de potenciales clientes de inmuebles para Aitué, basado en datos históricos de sus clientes
Autor : Cabrera Vives, Guillermo Felipe; supervisor de grado
Cárdenas Liebethal, Joaquín Antonio
Palabras clave : Aitue - Bases de Datos;Bases de Datos;Usuarios de Bases de Datos;Minería de Datos;Análisis de Regresión Logística
Fecha de publicación : 2019
Editorial : Universidad de Concepción.
Resumen : Para esta memoria de título se trabajó con la inmobiliaria Aitué. Se propuso como objetivo principal predecir la probabilidad de que un cotizante se convierta en cliente. Para lograr esto, se utilizaron datos de cotizaciones de 5 proyectos que actualmente están en venta. Se usó como marco de trabajo la metodología CRISP-DM. Aitué maneja una base de datos de personas que cotizan un inmueble y otra de quienes realizan negocios. A partir de estos datos se generó un nuevo dataset, que describe el comportamiento de las personas durante sus cotizaciones y su disposición a entregar datos personales. Además asignados etiquetas “negocio” y “compra”, como los atributos a predecir, los cuales representan el inicio de un proceso de venta y una venta finalizada respectivamente. Para el estudio se seleccionó el proyecto “San Andrés Del Valle”, el cual cuenta con la mayor cantidad de datos. Se abordaron 2 tareas, predecir un cliente para un cotizante nuevo y predecir un cliente en base su historial de cotizaciones. Para ambas tareas se utilizaron y compararon 5 técnicas de clasificación usadas en la literatura: ​Logistic Regression(LR), Decision Tree (DT), Random Forest (RF), XGBoost (XGB) y Support Vector Machine (SVM)​. Para elegir el mejor modelo se utilizó como métrica comparativa “el área bajo la curva” (AUC) del gráfico ​Receiver Operating Characteristics (​ROC) ​y el puntaje ​f1-score, privilegiando el ​primero. En la tarea de predecir un cliente cuando es un nuevo cotizante (Tarea 1) y variable objetivo “negocio”, el mejor modelo fue XGB con un​ AUC de 0.827 y un​ f1_scorede 0.652 y la variable objetivo “compra” el modelo RF fue el mejor, con un​ AUC de 0.926 y​ f1-score de 0.492. En la tarea de predecir un cliente cuando es un cliente histórico (Tarea2) con variable objetivo “negocio”, fue ​LR con un ​AUC de 0.833 y un ​f1_score de 0.598 y para la variable objetivo ”compra” el modelo RF obtuvo el mejor puntaje con un ​AUC de 0.807 y ​f1-score de 0.304. Ningún modelo superó un ​Lift de 1.5. Además se destacan como los atributos más significativos para la tarea 1 son: si entrega la dirección, la fecha de nacimiento y el número de integrantes de la familia, mientras que en la tarea 2 fueron la cantidad de cotizaciones y si es "recontacto". Con el fin de utilizar los resultados de forma práctica, se realizó un prototipo de una aplicación web, el cual busca simular el actual sistema de ingreso de cotizantes y cotizaciones utilizado en la empresa, integrando los modelos aprendidos.
Descripción : Ingeniero Civil Informático Universidad de Concepción 2019
URI : http://repositorio.udec.cl/jspui/handle/11594/400
metadata.dc.identifier.other: 241382
Aparece en las colecciones: Ingeniería Informática y Ciencias de la Computación - Tesis Pregrado

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Tesis_Prediccion_de_potenciales_clientes.pdf3,8 MBAdobe PDFVista previa
Visualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons