Análisis de datos de comportamiento de consumo de usuarios de comercio electrónico
Para las empresas de comercio electrónico en la etapa intermedia En esta etapa, las principales prioridades son estabilizar el flujo de clientes y aumentar las ventas en las tiendas;
Para las empresas de comercio electrónico a gran escala, se presta más atención a la retención y la actividad, y a mejorar el nivel operativo general.
En diferentes etapas, el enfoque de los indicadores del análisis de datos también es diferente.
Este artículo toma como ejemplo los registros de pedidos de un usuario de comercio electrónico y se centra en analizar la tendencia general del consumo de los usuarios y el comportamiento de consumo de los usuarios, y analiza varios puntos de datos centrales en la escala de los usuarios y su permanencia:
Mapa mental del proceso de análisis:
Los datos provienen de los registros de pedidos de los usuarios de un sitio web de comercio electrónico
Puntos de observación:
1. La fecha debe convertirse al formato
2. La cantidad de bienes comprados en la mayoría de los pedidos no es grande, el valor promedio es de alrededor de 2 y el valor extremo de 99 es muy grande, lo que provoca interferencia
3. La cantidad de consumo del usuario es relativamente estable y también hay valores extremos. Interferencia
Conversión de formato de tiempo: estable, uno aumenta y disminuye.
> El número medio de veces que un usuario consume es de entre 1 y 2 veces, con una tendencia al alza de 1997 a 1998
1. Frecuencia de consumo de los usuarios y cantidad de consumo
Cantidad de consumo de los usuarios y Diagrama de dispersión de distribución de frecuencia de consumo de usuarios
Según la distribución del diagrama de dispersión, los valores extremos tienen un impacto grave. Según el teorema de Chebyshev, filtra los datos
95% de los. los datos se concentran dentro de 5 desviaciones estándar de la media
Elimine los valores extremos y reajuste la distribución
La figura muestra aproximadamente La regresión lineal muestra que el precio unitario por cliente es relativamente estable
Histograma de tiempos de consumo de los usuarios:
La mayoría de los datos se concentran por debajo de 10 veces y una pequeña parte de los datos causa interferencias
Histograma de usuarios de tiempos de consumo:
La mayoría de ellos se concentran por debajo de 250 yuanes. La mayor parte de los datos están concentrados y una pequeña parte de los datos causa interferencia.
2. Consumo acumulativo del usuario.
p>
Ordene por cantidad de consumo, use la función de suma acumulada para calcular la proporción de consumo de los usuarios
El número de usuarios es 23,750, 50 personas solo representan 15 del consumo total y las 4,000 personas principales contribuyen 60 del consumo total de las 4000 personas principales contribuyeron con el 60% del consumo total
En otras palabras, el KPI del 60% se puede lograr manteniendo a los 4000 clientes principales
3. Ratio de consumo de clientes nuevos y antiguos
Gráfico mensual de tendencias de nuevos clientes
Gráfico mensual de tendencias de antiguos clientes
4. Tiempos de consumo de un solo usuario p>
Los clientes que solo han consumido una vez representaron el 51,14, la mitad de los clientes solo han comprado una vez
Comparación mensual:
5. Modelo de estratificación de usuarios-rfm
Utilice una tabla dinámica para extraer la cantidad de consumo del usuario, la fecha del último consumo y los datos de la cantidad de consumo
Cambie la fecha del último consumo al número de días desde la última fecha de consumo hasta hoy
(Dado que los datos son muy tempranos, para mostrarlos mejor y comparar estándares Cambie a la última fecha de consumo de todos los usuarios)
Los datos utilizan el valor promedio como valor estándar del Ejes x, y, z Escriba una función de Python para dividir los datos M, R y F del usuario en cuadrantes, utilizando 0 y 1 como valores estándar de los cuadrantes superior e inferior para dividir, y los usuarios. están marcados con los valores estándar de los cuadrantes superior e inferior respectivamente. División, etiquete al usuario por separado.
Las 8 categorías de etiquetas son: clientes de mantenimiento importantes, clientes de valor importantes, clientes de desarrollo importantes, clientes retenidos importantes, clientes de mantenimiento general, clientes de valor general, clientes de desarrollo general y clientes retenidos generales
Cuente las ventas totales, la frecuencia de consumo total y el número de usuarios de cada etiqueta
Los clientes retenidos en general tienen el mayor número, seguidos por los clientes de mantenimiento importantes, y los clientes de mantenimiento importantes representan la mayor proporción de ventas
El cliente con la mayor proporción de ventas de clientes de mantenimiento importantes
Diagrama de dispersión de estratificación de clientes de rfm:
Se puede ver en la estratificación de RFM que la mayoría de los usuarios son clientes de mantenimiento importantes, pero esto se debe a la influencia de valores extremos, lo que eleva el valor promedio y la clasificación de usuarios no es lo suficientemente precisa
6. Estratificación de usuarios: usuarios nuevos y antiguos, usuarios activos, usuarios recurrentes y usuarios perdidos
Utilice una tabla dinámica para contar el consumo mensual de cada usuario 1 significa comprado en ese mes, 0 significa no comprado en ese mes
Utilice la función de Python para marcar. según el consumo mensual del usuario
p>Cuente el número de usuarios de varios tipos cada mes
Un mapa de área más intuitivo:
Calcule la tasa de retorno y agrégalo a la tabla
7. Ciclo de vida de los usuarios
Calcula la diferencia de tiempo entre la primera compra del usuario y la última compra
El ciclo de vida promedio es 135 días, el más largo es 544 días
Comprado solo una vez Los usuarios tienen un mayor impacto en el ciclo de vida del usuario y pueden eliminarse
Excluyendo a los usuarios que solo han comprado una vez, podemos ver que el número de usuarios en los dos primeros extremos del ciclo de vida del usuario es relativamente grande y el valor medio es relativamente pequeño
8. Ciclo de compra del usuario
9. Tasa de recompra
La tasa de recompra se refiere a la proporción de usuarios que compran varias veces dentro de un mes natural
Utilice la función applymap para marcar el número de compras realizadas por los usuarios en cada mes de compra
Gráfico de líneas de tasa de recompra
La tasa de recompra se mantiene estable en alrededor de 20. El mes pasado, debido a que una gran cantidad de nuevos usuarios solo compraron una vez, lo que redujo la tasa de recompra
10. Tasa de recompra
La tasa de recompra se refiere a los usuarios que han comprado y vuelto a comprar dentro de un período de tiempo determinado Ratio
Utilice la marca de compra dividida en la sección anterior
0 significa que no hay compra en el mes actual, 1 significa compra en el mes actual
Escriba una función de Python para marcar el estado de recompra del usuario
Gráfico de líneas de la tasa de recompra p>