Please use this identifier to cite or link to this item: http://repositorio.udec.cl/jspui/handle/11594/400
Title: Predicción de potenciales clientes de inmuebles para Aitué, basado en datos históricos de sus clientes
Authors: Cabrera, Guillermo , supervisor de grado
Cárdenas Liebethal, Joaquín Antonio
Keywords: Aitue - Bases de Datos;Bases de Datos;Usuarios de Bases de Datos;Minería de Datos;Análisis de Regresión Logística
Issue Date: 2019
Publisher: Universidad de Concepción. Facultad de Ingeniería. Departamento de Ingeniería Informática y Ciencias de la Computación.
Abstract: Para esta memoria de título se trabajó con la inmobiliaria Aitué. Se propuso como objetivo principal predecir la probabilidad de que un cotizante se convierta en cliente. Para lograr esto, se utilizaron datos de cotizaciones de 5 proyectos que actualmente están en venta. Se usó como marco de trabajo la metodología CRISP-DM. Aitué maneja una base de datos de personas que cotizan un inmueble y otra de quienes realizan negocios. A partir de estos datos se generó un nuevo dataset, que describe el comportamiento de las personas durante sus cotizaciones y su disposición a entregar datos personales. Además asignados etiquetas “negocio” y “compra”, como los atributos a predecir, los cuales representan el inicio de un proceso de venta y una venta finalizada respectivamente. Para el estudio se seleccionó el proyecto “San Andrés Del Valle”, el cual cuenta con la mayor cantidad de datos. Se abordaron 2 tareas, predecir un cliente para un cotizante nuevo y predecir un cliente en base su historial de cotizaciones. Para ambas tareas se utilizaron y compararon 5 técnicas de clasificación usadas en la literatura: ​Logistic Regression(LR), Decision Tree (DT), Random Forest (RF), XGBoost (XGB) y Support Vector Machine (SVM)​. Para elegir el mejor modelo se utilizó como métrica comparativa “el área bajo la curva” (AUC) del gráfico ​Receiver Operating Characteristics (​ROC) ​y el puntaje ​f1-score, privilegiando el ​primero. En la tarea de predecir un cliente cuando es un nuevo cotizante (Tarea 1) y variable objetivo “negocio”, el mejor modelo fue XGB con un​ AUC de 0.827 y un​ f1_scorede 0.652 y la variable objetivo “compra” el modelo RF fue el mejor, con un​ AUC de 0.926 y​ f1-score de 0.492. En la tarea de predecir un cliente cuando es un cliente histórico (Tarea2) con variable objetivo “negocio”, fue ​LR con un ​AUC de 0.833 y un ​f1_score de 0.598 y para la variable objetivo ”compra” el modelo RF obtuvo el mejor puntaje con un ​AUC de 0.807 y ​f1-score de 0.304. Ningún modelo superó un ​Lift de 1.5. Además se destacan como los atributos más significativos para la tarea 1 son: si entrega la dirección, la fecha de nacimiento y el número de integrantes de la familia, mientras que en la tarea 2 fueron la cantidad de cotizaciones y si es "recontacto". Con el fin de utilizar los resultados de forma práctica, se realizó un prototipo de una aplicación web, el cual busca simular el actual sistema de ingreso de cotizantes y cotizaciones utilizado en la empresa, integrando los modelos aprendidos.
Description: Ingeniero Civil Informático Universidad de Concepción 2019
URI: http://repositorio.udec.cl/jspui/handle/11594/400
metadata.dc.identifier.other: 241382
Appears in Collections:Ingeniería Informática y Ciencias de la Computación - Tesis Pregrado

Files in This Item:
File Description SizeFormat 
Tesis_Prediccion_de_potenciales_clientes.pdf3,8 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.