文章目录
I、项目任务要求
任务描述:
- 关联分析用于发现用户购买不同的商品之间存在关联和相关联系,比如A商品和B商品存在很强的相关性,常用于实体商店或在线电商的推荐系统,例如某一客户购买A商品,那么他很有可能会购买B商品,通过大量销售数据找到经常在一起购买的商品组合,可以了解用户的购买行为,根据销售的商品推荐关联商品从而给出购买建议,寻找销售新的增长点。
- 本次实验采用关联算法从两方面对淘宝用户购物行为进行分析:
- (1)用户购买哪种商品次数最多;
- (2)用户购买的商品中,哪些商品组合关联度高。
- 实验内容:分别采用Apriori、FP-growth算法实现淘宝用户购物行为分析,并写出实验结果分析。
主要任务要求:
- 1、数据集下载网页(https://zhuanlan.zhihu.com/p/76357500)。
- 2、分别简述Apriori、FP-growth算法思想和实现原理。
- 3、写出实验结果分析:
- (1) 数据集描述。
- (2) 实验运行环境描述:如开发平台、编程语言、调参情况(最小支持度、最小置信度)等。
- (3) 采用Apriori算法实现淘宝用户购物行为分析。
- (4) 采用FP-growth算法实现淘宝用户购物行为分析。
- (5) 两种算法结果比较分析:
- 算法性能比较;
- 兴趣因子(支持度)评估比较;
- 淘宝用户购物行为分析比较。
II、原理描述
III、数据集描述
数据集来源
数据描述
变量分析
数据预处理
IV、具体实现过程
V、结果分析
VI、完整代码