0
点赞
收藏
分享

微信扫一扫

NLP第三讲Sklearn

一、数据集 sklearn.datasets

from sklearn.datasets import load_iris

iris = load_iris()
iris.keys()
iris.data.shape # (150,4)
iris.target.shape
iris.data
iris.featurs_names

玩具数据集

  1. 鸢尾花数据集
  2. 葡萄酒数据集
  3. 波士顿房价数据集
  4. 手写数字数据集
  5. 乳腺癌数据集
  6. 糖尿病数据集
  7. 体能训练数据集
    大数据集
    生成数据集
from sklearn.datasets.samples_generator import make_regression

X,y,coef = make_regression(n_samples=1000,n_features=1,noise=10,coef=True)
coef是参数
plt.plot(X,X*coef,color='red',linewidth=3)


举报

相关推荐

0 条评论