各位好,我是乾颐堂大堂子。领取完整实战指南可以私信我,关键词:实战指南~
本实验使用的数据集为tennis.txt,主要包含14个样本,每个样本包含天气相关的特征及是否适合打球。
步骤1导入依赖
步骤2定义函数,生成决策树
步骤3定义函数,保存生成的树图
步骤4定义函数,用于生成向量化数据
函数中,通过pd.Categorical(list).codes可以得到原始数据对应的序号列表,从而将类别信息转化成数值信息,这样就可以应用到模型中去了
步骤5调用函数进行预测
此时在本地生成决策树图,名称为“tennis.pdf”。