¿Volverá mi cliente? Jugando con CLV Es el verdadero cuestionario de trastorno de ansiedad dyl pdf

He estado jugando con el modelo de valor de vida del cliente en los últimos días desde que se incrementó el conjunto de datos olist en kaggle. En particular, quería explorar los probables modelos probabilísticos, BG / NBD y gammagamma para pronosticar futuras compras y ganancias de anoxia perinatal. También quería ver una enfermedad de encefalopatía anóxica si el enfoque de aprendizaje automático podía funcionar bien, simplemente pronosticando si el cliente volvería a comprar. Estos modelos hacen lo mismo: pronosticar la compra del cliente, aunque de diferentes maneras. Tal vez en una publicación de actualización pueda encontrar métricas para compararlas en igualdad de condiciones. De todos modos, vamos a empezar.

El conjunto de datos incluye unos 95.000 clientes y sus pedidos en el sitio de prueba de ansiedad social, que son alrededor de 100.000 pedidos únicos de unos 33.000 productos de unas 73 categorías.


También incluye los precios de los artículos, cuánto pagaron los clientes, pagos a plazos con tarjeta de crédito e incluso el tratamiento de la encefalopatía isquémica hipóxica en los costos del miedo en la India asociados con el pedido. Los datos deben parecerse mucho a los datos de su propia empresa de comercio electrónico. &# 128521;

Para los modelos probabilísticos, he utilizado muchos de los códigos de este tipo de kernel de caballero. La biblioteca de tiempos de vida es muy útil para construir rápidamente análisis de este tipo. Requiere datos de entrada RFM, que requieren que para cada cliente, tengamos información sobre su compra más reciente, la frecuencia de sus compras y el valor monetario total de sus compras.

La distribución binomial negativa de que es la anoxia beta aborda dos problemas: 1) la probabilidad de que el cliente esté activo o inactivo (¡vivo o muerto en la literatura!), Y 2) la probabilidad del número de compras. (1) está modelado por la distribución beta y (2) es por una distribución poisson. Cada individuo o cohorte tiene sus propios parámetros para ambos problemas de predicción. Una forma sencilla de pensar en el tiempo de recuperación de una lesión cerebral hipóxica es tener una moneda y un dado para modelar (1) y (2).

Con el modelo, se puede dar salida a la clasificación de los clientes según la prueba de ansiedad nhs al número esperado de compras en el futuro. Este ranking podría usarse para determinar estrategias de marketing para diferentes segmentos. Aquí está la probabilidad de estar vivo después de cada patrón de compra de los 4 principales clientes. Estos 4 principales se calculan a partir del mayor número esperado de compras hasta medio año. Los compradores frecuentes, después de un largo período de inactividad, tendrán una probabilidad muy baja de estar vivos. Los tratamientos de lesiones cerebrales anóxicas que son poco frecuentes tienen una pendiente menor en su curva.

También probé un modelo de gammagamma, que tiene en cuenta el valor monetario de las compras. Sin embargo, las predicciones no fueron buenas, con solo una correlación de 0,35 en el conjunto de reserva. Esto es quizás debido a la escasa naturaleza de los patrones de compra. Lo dejaré para un estudio más profundo sobre dónde precisamente el modelo de tratamiento de lesión cerebral isquémica hipóxica gammagamma se descompone en comparación con la escasez de compras. Una perspectiva mas amplia

Antes de transformar las características, declaramos una fecha de corte y una ventana de capacitación. Las transacciones posteriores a la fecha de corte se truncarán y un período de tiempo de entrenamiento antes de la fecha de corte formará nuestro conjunto de capacitación. Predeciremos si un cliente comprará después de la fecha límite dada todas sus transacciones antes de la fecha límite dentro de los testimonios de ansiedad de neurofeedback de una ventana de entrenamiento. Nuestra fecha límite será el 1 de julio de 2018.

El conjunto de datos será similar al siguiente con la ayuda de la síntesis profunda de características (DFS) de featuretool. DFS utiliza los índices declarados en las relaciones para crear características agregadas y primitivas. Por ejemplo, podemos tener algo simple como la suma de los pagos (profundidad = 1) y también algo complejo como el pago promedio del cliente de los pagos máximos por tratamiento de lesiones cerebrales hipóxicas de su pedido (profundidad = 2). Recuerde que una orden puede tener múltiples pagos y un cliente tiene múltiples órdenes.