NLP第三讲Sklearn-CFANZ编程社区

NLP第三讲Sklearn

一、数据集 sklearn.datasets

from sklearn.datasets import load_iris

iris = load_iris()
iris.keys()
iris.data.shape # (150,4)
iris.target.shape 
iris.data
iris.featurs_names

玩具数据集

鸢尾花数据集
葡萄酒数据集
波士顿房价数据集
手写数字数据集
乳腺癌数据集
糖尿病数据集
体能训练数据集
大数据集
生成数据集

from sklearn.datasets.samples_generator import make_regression

X,y,coef = make_regression(n_samples=1000,n_features=1,noise=10,coef=True)
coef是参数
plt.plot(X,X*coef,color='red',linewidth=3)

0 条评论