0
点赞
收藏
分享

微信扫一扫

【无监督学习】Kmeans聚类算法

_鱼与渔_ 2022-04-05 阅读 106

Ⅰ.原始数据

i.i.训练集

训练集

i.ii.测试集

测试集

Ⅱ.python程序

import pandas as pd
import numpy as np
from sklearn.cluster import KMeans

# 训练集数据
data=pd.read_excel('数据.xlsx',sheet_name='Sheet3')
x=np.array(data.iloc[:,1:]).T
kmeans=KMeans(n_clusters=3,random_state=0).fit(x)
category=data.columns[1:]
print('将训练集指标划分为3类:')
for i in range(len(category)):
    print(category[i],kmeans.labels_[i])

# 测试集数据
data2=pd.read_excel('数据.xlsx',sheet_name='Sheet4')
x_predict=np.array(data2.iloc[:,1:]).T
pre=kmeans.predict(x_predict)
print('按照训练集的聚类规则,测试集的预测结果为:')
category2=data2.columns[1:]
for i in range(len(category2)):
    print(category2[i],pre[i])

Ⅲ.结果

将训练集指标划分为3类:
 芹菜 2
 油菜 0
 黄瓜 0
 萝卜 0
 茄子 2
 西红柿 2
 土豆 0
 胡萝卜 0
 青椒 2
 尖椒 1
 豆角 1
 韭菜 2
 豆腐 0
按照训练集的聚类规则,测试集的预测结果为:
 鸡蛋 1
 菜籽油 1
 大豆油 1
 花生油 1
 芦柑 2
 苹果 1
 香蕉 2
 西瓜 0
 食用盐 0
 绵白糖 1
 白砂糖 1
 红糖 1
 酱油 1
 醋 2
 鲜牛奶 2
举报

相关推荐

0 条评论