一、数据集 sklearn.datasets
from sklearn.datasets import load_iris
iris = load_iris()
iris.keys()
iris.data.shape # (150,4)
iris.target.shape
iris.data
iris.featurs_names
玩具数据集
- 鸢尾花数据集
- 葡萄酒数据集
- 波士顿房价数据集
- 手写数字数据集
- 乳腺癌数据集
- 糖尿病数据集
- 体能训练数据集
大数据集
生成数据集
from sklearn.datasets.samples_generator import make_regression
X,y,coef = make_regression(n_samples=1000,n_features=1,noise=10,coef=True)
coef是参数
plt.plot(X,X*coef,color='red',linewidth=3)