Python可视化数据分析08、Pandas_Excel文件读写
📋前言📋
💝Python初始环境地址:【Python可视化数据分析01、python环境搭建】💝
环境需求
环境:win10
开发工具:PyCharm Community Edition 2021.2
数据库:MySQL5.6
目录
Python可视化数据分析08、Pandas_Excel文件读写
📋前言📋
环境需求
前言
Excel写入
Excel读取
其它操作
前言
使用Pandas读写Excel文件,需要安装openpyxl、xlsxwriter及xlrd这3个第三方库。
openpyxl:openpyxl源于PHPExcel,它提供了针对.xlsx文件的读写功能
xlsxwriter:用来将内容写入到.xlsx文件中
xlrd:用来读取.xls和.xlsx文件中的数据
安装顺序
pip3 install openpyxl
pip3 install xlsxwriter
pip3 install xlrd
Excel写入
import pandas as pd
df = pd.DataFrame({"id": [1, 2, 3], "name": ["雷静", "小凤", "春梦"], "age": ["21", "22", "20"]})
print(df)
# 写入到Excel文件
df.to_excel("test.xlsx", sheet_name='Sheet1')
Excel读取
import pandas as pd
df = pd.read_excel("test.xlsx")
print(df)
其它操作
import pandas as pd
df = pd.read_excel("test.xlsx")
# 基础信息
print(df.info)
# 查看列名
print(df.columns)
# 查看各列数据类型
print(df.dtypes)
# 查看下标
print(df.index)
# 数据浏览前2条
print(df.head(2))
# 查看name到age列
print(df.loc[:, "name":"age"])
# 基本统计
print("最大年龄:", df.age.max())
print("平均年龄:", df.age.mean())
# 查询
print(df[df.name == "春梦"])
# 排序·True正序False倒序
print(df.sort_values(by=["age"], ascending=False))
# 在第二列【下标是1】添加列
df.insert(1, "sex", "女")
print(df)
# 在最后添加列
df["introduce"] = "巾帼"
print(df)
# 删除某行
df = df.drop(1)
print(df)
# 替换
value = pd.Series([1, "女", "雷静静", 20, "大眼姑娘"], index=["id", "sex", "name", "age", "introduce"])
df.loc[0] = value
value = pd.Series([4, "女", "小龙女", 18, "冰山美人"], index=["id", "sex", "name", "age", "introduce"])
df.loc[3] = value
print(df)
# 条数
print(len(df))