多年以来电子商务业务快速发展,尤其是移动客户端发展迅猛,移动互联网时代的到来让原本就方便快捷的网上购物变得更加便利,而淘宝作为国内最大的电商交易平台更是具有巨大的流量优势。淘宝APP的功能日益复杂,但都离不开最基本的收藏、购物车和购买功能,本文利用sql、Tableau对淘宝用户行为数据进行分析,通过用户行为分析业务问题。
一. 提出问题
“用户行为分析”已经解答了AARRR漏斗模型分析的问题以及不同时段用户的行为数据分析。这里再做两个问题延展,作为本数据集运用分析的结尾。
分别为:
1.找到用户对商品的偏好,找到针对不同商品的营销策略
2.找出最具价值的核心付费用户群,对这部分用户的行为进行分析(RFM模型分析)
问题:
1.找到用户对商品的偏好,找到针对不同商品的营销策略
统计所有商品的购买次数,同时找到购买次数、浏览次数、收藏次数和加入购物车次数最多的商品。
SELECT item_id,COUNT(uid) AS 'times' FROM user_behavinor WHERE b_type='点击' GROUP BY item_id;
SELECT item_id,COUNT(uid) AS 'times' FROM user_behavinor WHERE b_type='收藏' GROUP BY item_id;
SELECT item_id,COUNT(uid) AS 'times' FROM user_behavinor WHERE b_type='加购' GROUP BY item_id;
SELECT item_id,COUNT(uid) AS 'times' FROM user_behavinor WHERE b_type='购买' GROUP BY item_id;
在本次统计的数据中,只点击一次的产品953种,点击了两次的产品有33种,本次分析的商品中用户购买的共有1000种商品,点击一次的商品占到95.3%,说明商品浏览量的增长主要依靠长尾商品的累积效应,而非爆款商品的带动。
列出销量前20位的商品,item_ID为127247596、303205878的商品购买次数最高,为6次,那么是否收藏次数最高的商品销量也最高呢,对商品浏览量也进行了统计:
我们看到收藏数最高的商品为34887409、97644171及169316912,并且销量最高的商品甚至都没有进入收藏前30名,说明这些吸引用户更多注意力的商品没有很好的转化为实际销量。
在加入购物车次数最多的前10个商品中,可以看到加购第一而不是销量第一,说明加购数与销量的关系并不是很明显直接。(这里截取的数据104万条,截取时段为一个月,可能存在数据量不足或者截取不够的原因,加大数据量可能关系会更明显)
2.基于RFM理论找出有价值的用户
我们首先统计出用户购买商品的最大值和最小值
数据源中没有相关的金额数据,因此通过 R 和 F 的数据对客户价值进行打分。
R-最近购买时间
用户数据的时间范围为一个月,最近购买时间的区间为0-30,将其分为5档,0-6,7-12,13-18,19-24,25-30分别对应评分0到4;
F-消费频率
付费用户中消费次数从低到高为1-15次,将其分为5档,1-3,4-6,7-9,10-12,13-15分别对应评分0到4
CREATE VIEW pay_E AS
SELECT uid,DATEDIFF('2014-12-18',MAX(dates)) AS B , COUNT(*) AS A
FROM user_behavinor WHERE b_type='购买' GROUP BY uid;
###创建视图
SELECT uid, (CASE WHEN B BETWEEN 25 AND 30 THEN 0
WHEN B BETWEEN 19 AND 24 THEN 1
WHEN B BETWEEN 13 AND 18 THEN 2
WHEN B BETWEEN 7 AND 12 THEN 3
WHEN B BETWEEN 0 AND 6 THEN 4 ELSE NULL END) AS R,
(CASE WHEN A BETWEEN 1 AND 3 THEN 0
WHEN A BETWEEN 4 AND 6 THEN 1
WHEN A BETWEEN 7 AND 9 THEN 2
WHEN A BETWEEN 10 AND 12 THEN 3
WHEN A BETWEEN 13 AND 15 THEN 4 ELSE NULL END) AS F
FROM pay_E
ORDER BY R DESC,F DESC;
将R和F的评分合并后结果:
uid | R | F |
110976685 | 4 | 4 |
102825286 | 4 | 4 |
35389479 | 4 | 4 |
71714329 | 4 | 4 |
1926899 | 4 | 4 |
20379505 | 4 | 4 |
4120403 | 4 | 4 |
50244004 | 4 | 3 |
85336332 | 4 | 3 |
4361577 | 4 | 3 |
138735272 | 4 | 3 |
110883373 | 4 | 3 |
109613455 | 4 | 3 |
33797179 | 4 | 3 |
79253885 | 4 | 3 |
14281644 | 4 | 3 |
22393155 | 4 | 3 |
17821367 | 4 | 3 |
122867103 | 4 | 3 |
12210870 | 4 | 3 |
15541192 | 4 | 3 |
142227202 | 4 | 3 |
44059193 | 4 | 3 |
79269988 | 4 | 3 |
61596634 | 4 | 3 |
107034437 | 4 | 3 |
26509398 | 4 | 3 |
54970164 | 4 | 3 |
65982317 | 4 | 3 |
97354034 | 4 | 3 |
从中我们可以得到用户的RFM分数,用户ID110976685、102825286、35389479、71714329、1926899、20379505、4120403R、F均是4分,是体系中的最有价值用户,需要重点关注,并且活动投放时需谨慎对待,不要引起用户反感。对于R值为4而F值为0的用户,用户粘性不强而消费时间间隔较短,运营活动可以重点针对这部分用户,提高用户使用产品的频率,可以通过拼团打折、积分兑换等活动唤起用户注意力。
借鉴数据分析猴子一书中的RFM模型解释图:
我们提取出评分最高的用户110976685行为数据,发现该用户几乎每天都产生了点击和收藏行为,而购物车的使用频率非常低,为0次。考虑到这是双十一刚刚过去一周左右,用户的购买热情与商家的优惠活动接近结束末期,用户的购物出现短暂的高涨期,随后区域正常。对此,可以根据该用户的活跃规律进行相关活动的推送,由于商品种类数据为脱敏数据,很遗憾此处无法分析该用户购买的商品类型。
五. 结论与建议
本文分析了淘宝APP用户行为数据共104万条,从两个角度提出业务问题,和BFM模型分析数据给出如下结论和建议。
1.找到用户对不同种类商品的偏好,找到针对不同商品的营销策略
商品售卖主要依靠长尾商品的累积效应,而非爆款商品的带动。销量最高的商品浏览数都没排进前20位,而浏览次数最高的商品甚至没有进入销量前20,说明这些吸引用户更多注意力的商品没有很好的转化为实际销量。
针对浏览量高而销量不高的这部分商品,需要提高的是用户从点击进入商品详情页到最终购买的体验。作为商家端可以从以下几个方面提高销售额:
(1) 商品详情页的实际价格是否相比展示价格偏差过大,有的商家为了吸引用户点击在商品展示页投放的价格具有较强吸引力,但实际价格偏高,在用户心中反而引起反感
(2)详情页的信息流展示是否合理,是否将用户最想看到的部分置于容易看到的位置,便于信息的获取
(3)优化商品展示的形式,利用视频等方式给用户更直观的感受,提高照片的美观程度
(4)评论区评价管理,尤其对于差评区的用户反馈进行认真对待,提高自身服务质量
2.通过RFM模型找出最具价值的核心付费用户群,对这部分用户的行为进行分析
R和F评分都很高的用户是体系中的最有价值用户,需要重点关注,并且活动投放时需谨慎对待,不要引起用户反感。对于R值为4而F值为0的用户,用户粘性不强而消费时间间隔较短,运营活动可以重点针对这部分用户,提高用户使用产品的频率,可以通过拼团打折、积分兑换等活动唤起用户注意力。