利用pandas读取Excel表并处理成dataframe格式:
import pandas as pd
from pandas import DataFrame
import numpy as np
total_data = pd.read_excel('/Users/appler/Downloads/gzmxb.xls')
total_data = pd.DataFrame(total_data)
print(total_data) #通常会通过print来检查一下是否顺利读取
进行数据的进一步处理,如:
(1)利用不同列之间的数量关系进行新变量的合成:
#进行新变量运算
list=total_data["应付工资"]+total_data["单位缴纳社保"]+total_data["单位缴纳住房公积金"]
#加上一列,形成新变量列
total_data["单位支付合计数"]=list
print(total_data) #输出检查