0
点赞
收藏
分享

微信扫一扫

数据清洗之 Excel文件读写


Excel文件读写

  • 使用read_excel读取,读取后的结果为dataframe格式
  • 读取excel文件和csv文件参数大致一样,但要考虑工作表sheet页
  • 参数较多,可以自行控制,但很多时候使用默认参数
  • 读取excel时,注意编码,常用编码为utf-8、gbk、gbk2312和gb18030等
  • 使用to_excel快速保存为xlsx格式

import pandas as pd
import

os.getcwd()

'D:\\Jupyter\\notebook\\Python数据清洗实战\\数据清洗之文件读写'

os.chdir('D:\\Jupyter\\notebook\\Python数据清洗实战\\数据')

df1 = pd.read_excel('meal_order_detail.xlsx', encoding='utf-8', sheet_name='meal_order_detail1')

df1.head(5)



detail_id

order_id

dishes_id

logicprn_name

parent_class_name

dishes_name

itemis_add

counts

amounts

cost

place_order_time

discount_amt

discount_reason

kick_back

add_inprice

add_info

bar_code

picture_file

emp_id

0

2956

417

610062

NaN

NaN

蒜蓉生蚝

0

1

49

NaN

2016-08-01 11:05:36

NaN

NaN

NaN

0

NaN

NaN

caipu/104001.jpg

1442

1

2958

417

609957

NaN

NaN

蒙古烤羊腿\r\n\r\n\r\n

0

1

48

NaN

2016-08-01 11:07:07

NaN

NaN

NaN

0

NaN

NaN

caipu/202003.jpg

1442

2

2961

417

609950

NaN

NaN

大蒜苋菜

0

1

30

NaN

2016-08-01 11:07:40

NaN

NaN

NaN

0

NaN

NaN

caipu/303001.jpg

1442

3

2966

417

610038

NaN

NaN

芝麻烤紫菜

0

1

25

NaN

2016-08-01 11:11:11

NaN

NaN

NaN

0

NaN

NaN

caipu/105002.jpg

1442

4

2968

417

610003

NaN

NaN

蒜香包

0

1

13

NaN

2016-08-01 11:11:30

NaN

NaN

NaN

0

NaN

NaN

caipu/503002.jpg

1442

df1 = pd.read_excel('meal_order_detail.xlsx', encoding='utf-8', sheet_name=0)  # sheet_name 可根据索引值取工作簿 等于0即为第一个工作簿

df1.head(5)



detail_id

order_id

dishes_id

logicprn_name

parent_class_name

dishes_name

itemis_add

counts

amounts

cost

place_order_time

discount_amt

discount_reason

kick_back

add_inprice

add_info

bar_code

picture_file

emp_id

0

2956

417

610062

NaN

NaN

蒜蓉生蚝

0

1

49

NaN

2016-08-01 11:05:36

NaN

NaN

NaN

0

NaN

NaN

caipu/104001.jpg

1442

1

2958

417

609957

NaN

NaN

蒙古烤羊腿\r\n\r\n\r\n

0

1

48

NaN

2016-08-01 11:07:07

NaN

NaN

NaN

0

NaN

NaN

caipu/202003.jpg

1442

2

2961

417

609950

NaN

NaN

大蒜苋菜

0

1

30

NaN

2016-08-01 11:07:40

NaN

NaN

NaN

0

NaN

NaN

caipu/303001.jpg

1442

3

2966

417

610038

NaN

NaN

芝麻烤紫菜

0

1

25

NaN

2016-08-01 11:11:11

NaN

NaN

NaN

0

NaN

NaN

caipu/105002.jpg

1442

4

2968

417

610003

NaN

NaN

蒜香包

0

1

13

NaN

2016-08-01 11:11:30

NaN

NaN

NaN

0

NaN

NaN

caipu/503002.jpg

1442

os.getcwd()

'D:\\Jupyter\\notebook\\Python数据清洗实战\\数据'

df1.to_excel('asdf.xlsx', index=False, sheet_name='one')


举报

相关推荐

0 条评论