pandas使用教程-CFANZ编程社区

pandas使用教程

一、读取文件

import pandas as pd
df = pd.read_excel(flie_path, header=2) # header默认为0，为2则将第三行作为标题,flie_path文件路径
df = pd.read_csv(flie_path，index_col=False))  # 读取csv文件，index_col=False为去掉索引列

二、创建内容

a = [['张三',20,'男'],
     ['李四',16,'男'],
     ['小芳',18,'女']]
df = pd.DataFrame(data=a,columns=['姓名','年龄','性别'])

在这里插入图片描述

a = {'学科':['数学','语文','英语'],
     '分数':[100,90,68],
     '排名':[1,5,18]}
df = pd.DataFrame(data=a)

在这里插入图片描述

三、获取内容

1、获取标题

title = df.columns.values   # title = ['学科' '分数' '排名']

2、获取行数、列数

row_column_num = df.shape   # row_column_num = (行数,列数)

3、获取某列内容

subject = df['学科'].values  # subject = ['数学' '语文' '英语']

4、按条件读取一整行数据（条件取行）

content = df[df['学科']=='语文'].values[0]   # content = ['语文' 90 5]

5、获取某行某列内容（条件取值）

score = df.loc[df['学科']=='语文','分数'].values[0]  # score = 90

6、按坐标获取内容（坐标取值）

content = df.iloc[0,0]    # content = 数学

四、修改内容

1、按坐标修改

df.iloc[0,0] = '物理'  # 修改该坐标值为物理

2、按条件修改

df.loc[df['学科'] == '语文','分数'] = 66    # 修改满足该条件内容为 66

五、删除内容

1、删除某行、某列

df.drop(1,inplace=True)  # 删除索引为1的行
df.drop('分数',axis=1,inplace=True)  # 删除分数整列，axis=1表示对列操作
df.drop(columns=['排名'],inplace=True)  # inplace=True 表示在当前df中删除数据

2、按条件删除某行

df.drop(df[df['分数'] == 90].index, inplace=True)  # 删除分数为90的行

六、保存为文件

df.to_excel('file_name.xlsx')  # 保存为excel文件
df.to_csv('file_name.csv',index=False) # 保存为csv文件,index=False为去掉索引列

0 条评论