一、读取文件
import pandas as pd
df = pd.read_excel(flie_path, header=2) # header默认为0,为2则将第三行作为标题,flie_path文件路径
df = pd.read_csv(flie_path,index_col=False)) # 读取csv文件,index_col=False为去掉索引列
二、创建内容
a = [['张三',20,'男'],
['李四',16,'男'],
['小芳',18,'女']]
df = pd.DataFrame(data=a,columns=['姓名','年龄','性别'])
a = {'学科':['数学','语文','英语'],
'分数':[100,90,68],
'排名':[1,5,18]}
df = pd.DataFrame(data=a)
三、获取内容
1、获取标题
title = df.columns.values # title = ['学科' '分数' '排名']
2、获取行数、列数
row_column_num = df.shape # row_column_num = (行数,列数)
3、获取某列内容
subject = df['学科'].values # subject = ['数学' '语文' '英语']
4、按条件读取一整行数据(条件取行)
content = df[df['学科']=='语文'].values[0] # content = ['语文' 90 5]
5、获取某行某列内容(条件取值)
score = df.loc[df['学科']=='语文','分数'].values[0] # score = 90
6、按坐标获取内容(坐标取值)
content = df.iloc[0,0] # content = 数学
四、修改内容
1、按坐标修改
df.iloc[0,0] = '物理' # 修改该坐标值为物理
2、按条件修改
df.loc[df['学科'] == '语文','分数'] = 66 # 修改满足该条件内容为 66
五、删除内容
1、删除某行、某列
df.drop(1,inplace=True) # 删除索引为1的行
df.drop('分数',axis=1,inplace=True) # 删除分数整列,axis=1表示对列操作
df.drop(columns=['排名'],inplace=True) # inplace=True 表示在当前df中删除数据
2、按条件删除某行
df.drop(df[df['分数'] == 90].index, inplace=True) # 删除分数为90的行
六、保存为文件
df.to_excel('file_name.xlsx') # 保存为excel文件
df.to_csv('file_name.csv',index=False) # 保存为csv文件,index=False为去掉索引列