用户行为分析主要包括哪些内容,用户行为分析介绍
数据
:CDNOW网站用户购买专线3558 www.Sina.com/:根据cdnow网站的用户购买银行分析用户的消费行为。
目的
原始数据没有提供分析目的所需的行为数据,因此需要根据已知数据构建指标。因为目的是分析用户的消费行为,所以采用维度分析,从特定的角度和层面来分析数据。
分析思路
一、销售和消费金额分析
二。消费的时间节点
三。回购率回购率分析
四。用户分层
动词(verb的缩写)用户生命周期和消费周期
我们先来看看原始数据的基本信息。如果您右键单击“在新标签中打开图像”,将显示一个更大的图像。)
可以看到总共有69,658行4列数据,没有空值。数据类型是数字,数据是干净的。然后根据分析要求进行数据处理。接下来,分析这些数据。
分析内容
我们先来看销售和消费的基本统计。
order_products的销量平均值为2.41,标准差为2.33,呈现小幅波动。75%的四分位数是3,也就是说很多用户一次买的不到3件。购买金额order_amount相同,大部分都是小单子,也符合消费者数据的基本认知,
一、 销量和消费金额分析
,大部分用户贡献的价值不高。接下来我们来看看用户群中销量和消费金额的基本统计。
请看直方图。
从用户角度来看,平均每个用户买7件商品,客单价106,大部分是小用户。销量_产品和消费金额订单_金额的平均值接近75%四分位数,显示为
长尾型分布
。这是我们必须关注的。以月亮为统计窗口也常用于数据分析,按月分组,观察销量和消费金额。
为了反映时间的趋势,折线图是通用的。
可以看到1997年1-4月的销量很高,之后很稳定。消费金额也是如此,可能和推广有关。
存在少量高额高量消费用户
看消费节点的数据。这是用户第一次也是最后一次消费的时间。
可以看出,用户的第一次消费集中在1997年的前三个月。说不出具体原因。因为原始数据本身是不完整的,可能只提取了部分用户的数据。最终消费时间主要集中在前三个月,未来仍会有稳定消费。未来仍有稳定消费的用户,可以广义定义为老客户。
二、消费的时间节点
了解回购率的定义。复购率是指一定时间内消费超过两次的用户占总消费用户的比例。这里的时间窗口是一个月,
三、复购率,回购率分析
。计算回购率,用折线图表示。
前期回购率较低,10%左右,可能是因为新客户多,后期稳定在20%左右。接下来,我们来看看回购率。
与复购率不同的是,复购率是在某段时间内消费的用户在下一段时间内继续消费的比例。时间窗口仍然是一个月,使用数据透视表。代码有点复杂,需要通过函数来判断。
用于确定上月是否有消费的功能代码。
def purchase _ return(x):l=[]for iinrange)17):ifx)I)==1:ifx(I1)==1:l . append(1)ifx
可以看到早期回购利率在15%左右,之后达到35%,比较稳定。前期新客人多,但后期可能因为老客户,
数据透视表
。综合复购率和复购率,老客户质量挺高的,忠诚度还可以。回购率达到35%,回购率达到20%。
老客忠诚率大于新客
用户分层是指在一定时间范围内,将用户划分为不同的类别,以消费作为判断依据。一般用户分为新用户、非活跃用户、活跃用户和回归用户。用户划分的意义在于区分不同价值观的用户,这是精细化运营的要求。
这里,新用户指的是在该时间段内第一次消费的用户,非活跃用户指的是在该时间段内没有消费的老用户,活跃用户指的是在该时间段内消费过并且也在前一时间段消费过的用户。回流是没有消费的老客户
[]for I in range(18):if x[I]==0:if len(l)0:if l[I-1]= unreg :l . append( unreg )Else:l . append( unreg )Else:iflen(l)==0:l . append( new )Else:if l[I-1]= unactive :l . append( return )elif l[I-1]= unreg :l . append( new
接下来,计算每种用户类型的数量。
面积图可以直观的显示各元素的比例。我们来看看各用户类型的占比。
可见前期新客户占比较大。后期不活跃用户占大多数,但这不是我们分析的重点。活跃用户和回头客都是高价值的消费用户,新客户可以忽略。后期活跃用户和回头客用户占比趋于稳定,还是比较健康的情况。
我们来看一下每个月的活跃用户和回头客用户的比例。
可以看出,后期活跃用户占比稳定在3%-5%,有下降趋势。用户回访比例后期稳定在5%-8%,有下降趋势。
活跃用户和回流用户属于真正意义上的消费用户
,相比四六。
五、用户生命周期和消费周期
运营的目的是尽可能延长用户的生命周期,在生命周期中获得更多的价值。这就需要我们去分析用户的生命周期。此外,把握用户的消费周期和用户的一般消费规律,有助于指定更好的运营策略,引导用户更多消费。
先把用户分组,再看用户的生命周期。计算公式是最后一次消费时间减去第一次消费时间。这里过滤掉只有一次消费的用户。
下面是生命周期直方图。
可以看出,平均生命周期为216天。直方图显示了双峰趋势。虽然前期有大量用户消费过两次以上,但并没有持续。消费后一个月应该是
加以引导
。如果消费周期超过400天,则属于忠实用户,需要重点维护,制定个性化运营策略。分析完用户的生命周期,再来看看用户的消费周期,也就是两次消费的间隔。
Python代码实现也相对简单。先搞清楚每次消费和第一次消费的时间间隔。
然后对用户进行分组,利用shift函数计算用户当前消费与上次消费的时间差,得到基本的统计数据。
看时差直方图。
可以看出,用户的平均消费区间为0.10-5.9万天。0.10-5.9万天后,可以通过短信等方式对用户进行营销。当然,具体的消费时间间隔可以根据用户类型来选择。
最后,我们根据实际业务,以3天、周、月、季年来看一下不同时期的销售情况,从而了解不同时期用户的消费能力。还是用透视表来具体展现?
看不同周期的平均消费能力。
可以看出,第一次消费后0-3天内消费的最低金额约为36天,180-365天内消费的最高金额约为92天。但后者的计算周期较长。相对来说,第一次购买后一周内的总消费就不错,第二次营销要在第一次购买后一周内进行。
结论:本文分析了用户消费行为的五个重要方面,较为全面地总结了用户的消费行为。本文采用经典的量纲分析方法,通过观察不同维度的数据,得出有效的分析结论。本文使用Python语言,方便了海量数据的处理。最后,与业务的结合才是数据分析最有效的姿态。