0

点赞

收藏

分享

【数据科学】04 数据加载与数据保存

香小蕉 2022-04-15 阅读 58

标签: python 数据分析

文章目录

1. 加载csv/txt格式文件
2. 文件保存

1. 加载csv/txt格式文件

pd. read_csv()
pd.read_table()

参数	说明
path	唯一必填参数，表示文件路径名、URL、文件型对象的字符串
sep	用于对文件中各个字段进行拆分的字符序列或正则表达式，默认使用逗号作为分隔符
header	用作DataFrame列名的行号，默认为0（即第一行）。数据中心没有标题行时，设置header=None
index_col	用作索引的列编号或列名。可以是单个列名/列编号，也可以是多个列名/列编号组成的列表
names	可用来对列重命名，即添加新的表头。
skiprows	需要忽略的行数（从文件开始处算起），或需要跳过的行号列表
nrows	需要读取的行数
iterator	返回一个TextParser对象，一遍逐块读取文件
chunksize	文件块的大小，用于迭代
Ship_footer	需要忽略的行数（从文件尾开始算起）
encoding	文本编码格式

2. 文件保存

DataFrame.to_csv()

参数	说明
path	唯一必填参数，表示文件路径名、URL、文件型对象的字符串
sep	用于对文件中各个字段进行拆分的字符序列或正则表达式，默认使用逗号作为分隔符
mode	导出模式，‘w’为导出到新文件，‘a’为追加到现有文件末尾
index	是否导出航索引，默认为True
header	是否导出列索引，默认为True

希望能够对你有所帮助。

0 条评论

关注