Modelo de Lead Scoring para Optimización Comercial

2 de marzo de 2025

Este proyecto ataca un problema central en ventas: los equipos comerciales invierten demasiado tiempo en "leads" o clientes potenciales de baja calidad, mientras podrían estar cerrando ventas con aquellos más propensos a comprar. La avalancha de leads generada por marketing a menudo crea un cuello de botella, saturando al equipo comercial y perdiendo oportunidades.

El objetivo fue doble: primero, segmentar la base de datos para entender los perfiles de leads existentes; y segundo, construir un modelo de Machine Learning para predecir la probabilidad de compra. El fin es transformar una lista caótica en una hoja de ruta priorizada, enviando al equipo de ventas solo las oportunidades de mayor calidad.

1. Diseño del Proyecto y Calidad de Datos

Partimos de un dataset histórico con miles de leads, incluyendo su origen, comportamiento en la web y si finalmente compraron o no. La primera fase fue un profundo análisis de calidad de datos, donde además de la limpieza e imputación de nulos, se tomaron decisiones de negocio. Por ejemplo, se descartó al 9% de los registros que habían solicitado explícitamente no recibir emails, ya que no tiene sentido incluirlos en un modelo de gestión comercial.

2. Preparación de Datos y Segmentación

Con los datos limpios, se realizaron las transformaciones necesarias (encoding y reescalado) para preparar el dataset. El primer gran resultado fue una segmentación de clientes que identificó 4 grupos distintos. Descubrimos un perfil de altísimo potencial: el Segmento 1, que representaba el 37% de los leads, tenía una tasa de compra del 90%. Este perfil se caracterizaba por venir de un formulario específico, ser una referencia y haber descargado un contenido clave.

3. Creación del Modelo de Scoring Predictivo

El objetivo final era la herramienta predictiva. Tras una preselección de las variables más importantes, se construyó un pipeline de Machine Learning. El resultado fue un modelo con un 84% de capacidad predictiva, testeado de forma robusta. Este modelo analiza cada nuevo lead y le asigna un "score" o probabilidad de compra, permitiendo al sistema filtrar y enviar al equipo comercial únicamente los leads con verdadero potencial.

4. Entregable: Código en Producción

A diferencia de otros proyectos, el entregable final no fue un informe, sino un código de producción. Este script encapsula toda la lógica de limpieza, transformación y predicción del modelo, listo para ser implementado en los sistemas de la empresa y automatizar la priorización de leads en tiempo real.

Presentación del Caso