Pandas对缺失值的处理-CFANZ编程社区

Pandas对缺失值的处理

isnull和notnull：检测是否是空值，可用于df和series
dropna：丢弃、删除缺失值
- axis : 删除行还是列，{0 or ‘index’, 1 or ‘columns’}, default 0
- how : 如果等于any则任何值为空都删除，如果等于all则所有值都为空才删除
- inplace : 如果为True则修改当前df，否则返回新的df
fillna：填充空值
- value：用于填充的值，可以是单个值，或者字典（key是列名，value是值）
- method : 等于ffill使用前一个不为空的值填充forword fill；等于bfill使用后一个不为空的值填充backword fill
- axis : 按行还是列填充，{0 or ‘index’, 1 or ‘columns’}
- inplace : 如果为True则修改当前df，否则返回新的df

import pandas as pd
df = pd.read_excel("../student_excel.xlsx",engine="openpyxl"
                   ,skiprows=2)
print(df)

a = df.isnull()
print(a)

b = df["分数"].isnull()
print(b)

c = df["分数"].notnull()
print(c)

d = df.loc[df["分数"].notnull(),:]
print(d)

df.dropna(axis = "columns",how="all",inplace= True)
#当姓名这一列为空时，删除对应的行（无输出结果图片）
df.dropna(subset = ["姓名"],axis = 0,how="any",inplace= True)
print(df)

#第一种表达方式
e = df.fillna({"分数":0})
print(e)
#第二种表达方式
df.loc[:,"分数"] = df["分数"].fillna(0)
print(df)

#用的第六步第一种表达方式替换分数为NaN的值为0，所以接下来用e这个参数
e.loc[:,"姓名"] = e["姓名"].fillna(method="ffill")
print(e)

e.to_excel("/Users/allin947/PycharmProjects/untitled/this/ant-learn-pandas/mz_test/student_excel_new.xlsx",index = False)

0 条评论