练习10-删除数据
探索Iris纸鸢花数据
步骤1 导入必要的库
运行以下代码
import pandas as pd
import numpy as np
步骤2 数据集地址
运行以下代码
#从目标地址导入数据集
path10 ='D:/hailong/hailong_download/pandas_exercise/exercise_data/iris.csv' # iris.csv
步骤3 将数据集存成变量iris
运行以下代码
iris = pd.read_csv(path10)
iris.head()
步骤4 创建数据框的列名称
运行以下代码
iris = pd.read_csv(path10,names = ['sepal_length','sepal_width','petal_length','petal_width','class'])
iris.head()
步骤5 数据框中有缺失值吗?
运行以下代码
pd.isnull(iris).sum()
步骤6 将列petal_length的第10到19行设置为缺失值
运行以下代码
iris.iloc[10:20,2:3] = np.nan
iris.head(20)
步骤7 将缺失值全部替换为1.0
运行以下代码
iris.petal_length.fillna(1,inplace = True)
iris
步骤8 删除列class
运行以下代码
del iris['class']
iris.head()
步骤9 将数据框前三行设置为缺失值
运行以下代码
iris.iloc[0:3,:] = np.nan
iris.head()
步骤10 删除有缺失值的行
运行以下代码
iris = iris.dropna(how = 'any')
iris.head()
步骤11 重新设置索引
运行以下代码
iris = iris.reset_index(drop = True)
iris.head()