0
点赞
收藏
分享

微信扫一扫

Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化

Apriori 算法是一个相当新的算法,由 Agrawal 和 Srikant 于 1994 年提出。它是一种用于频繁项集挖掘的算法,允许公司理解和组织向上销售和交叉销售活动。

最强大的应用程序之一是我们在亚马逊上在线购物时看到的推荐系统 - 以及当今几乎所有电子商务网站上都存在的各种其他版本。

这是为了帮助理解一个非常简单的数据集,其中包含单个国际标准书号 (ISBN),它是一本书的唯一国际出版商标识符号。每行代表购买了所列书籍的唯一客户。

目标是了解基本购买行为,向客户推荐的其他书籍是什么——这样它可以提高公司的收入以及对所提供服务的整体满意度。

我们以网络图结束,该图展示了置信度高于 55% 的关系。


设置和导入数据集

import numpy as np
import pandas as pd

data.head()

Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_r语言

data.shape

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_数据_02

数据集上的EDA

#执行堆叠的步骤,转换为字符串,包括删除索引
dt2 = pd.DataFrame
dt2 = dt2.reset_index(drop = True)

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_数据集_03

dt2.nunique()  # 总共有4,999本独特的书籍

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_开发语言_04

#数据集中购买最多的前10本书
top0 = pd.DataFrame(dt2.value_counts(sort= True, ascending=False).head(10))
to10

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_python_05

# 创建条形图 
plt.bar(t0.index, top_10['Frequency'])

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_数据集_06

预处理

tdf = t.fit(d2).transform(da2)

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_python_07

ted = t.fit(r).transform(tr)
t_f

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_数据集_08

tdf = df.astype("int")

t_f

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_r语言_09

oks = d.DataFrame(tf, columns=e.columns_)
bos.head()

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_python_10

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_开发语言_11

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_python_12

建立Apriori模型

runets = apriori(o2, min_support=0.01, use_colnames=True)
feqts

Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_开发语言_13

fetes.sort_values( by = ['support'] ,ascending = False)

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_数据集_14

rls  =  assoc(fret, metric = "lift", min_threshold = 1)

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_开发语言_15

re.solues('confidence', ascending = False)
ruls.head()

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_r语言_16

rul = rls[res['confidence'] >= 0.55]
rue

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_开发语言_17

结论网络图

fig, ax = plt.subplots(figsize = (10,6))
G = x.from_pandas_edgelist(ul,source = 'antecedents')
n.draw(A)

 Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_r语言_18

Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化_数据集_19

最受欢迎的见解

1.采用spss-modeler的web复杂网络对所有腧穴进行分析

2.用R语言和python进行社交网络中的社区检测

3.R语言文本挖掘NASA数据网络分析,tf-idf和主题建模

4.在R语言中使用航空公司复杂网络对疫情进行建模

5.python隶属关系图模型 基于模型的网络中密集重叠社区检测

6.使用Python和SAS Viya分析社交网络

7.关联网络分析:已迁离北京外来人口的数据画像

8.情感语义网络​:游记数据感知旅游目的地形象

9.用关联规则数据挖掘探索药物配伍中的规律


举报

相关推荐

0 条评论