0
点赞
收藏
分享

微信扫一扫

Pandas数据分析练习10

Mhhao 2021-09-28 阅读 88

练习10-删除数据

探索Iris纸鸢花数据


步骤1 导入必要的库

运行以下代码

import pandas as pd

import numpy as np

步骤2 数据集地址

运行以下代码

#从目标地址导入数据集

path10 ='D:/hailong/hailong_download/pandas_exercise/exercise_data/iris.csv'  # iris.csv

步骤3 将数据集存成变量iris

运行以下代码

iris = pd.read_csv(path10)

iris.head()

步骤4 创建数据框的列名称

运行以下代码

iris = pd.read_csv(path10,names = ['sepal_length','sepal_width','petal_length','petal_width','class'])

iris.head()

步骤5 数据框中有缺失值吗?

运行以下代码

pd.isnull(iris).sum()

步骤6 将列petal_length的第10到19行设置为缺失值

运行以下代码

iris.iloc[10:20,2:3] = np.nan

iris.head(20)

步骤7 将缺失值全部替换为1.0

运行以下代码

iris.petal_length.fillna(1,inplace = True)

iris

步骤8 删除列class

运行以下代码

del iris['class']

iris.head()

步骤9 将数据框前三行设置为缺失值

运行以下代码

iris.iloc[0:3,:] = np.nan

iris.head()

步骤10 删除有缺失值的行

运行以下代码

iris = iris.dropna(how = 'any')

iris.head()

步骤11 重新设置索引

运行以下代码

iris = iris.reset_index(drop = True)

iris.head()


代码截图

举报

相关推荐

0 条评论