0
点赞
收藏
分享

微信扫一扫

【数据科学】04 数据加载与数据保存

香小蕉 2022-04-15 阅读 54

文章目录


1. 加载csv/txt格式文件

  • pd. read_csv()
  • pd.read_table()
参数说明
path唯一必填参数,表示文件路径名、URL、文件型对象的字符串
sep用于对文件中各个字段进行拆分的字符序列或正则表达式,默认使用逗号作为分隔符
header用作DataFrame列名的行号,默认为0(即第一行)。数据中心没有标题行时,设置header=None
index_col用作索引的列编号或列名。可以是单个列名/列编号,也可以是多个列名/列编号组成的列表
names可用来对列重命名,即添加新的表头。
skiprows需要忽略的行数(从文件开始处算起),或需要跳过的行号列表
nrows需要读取的行数
iterator返回一个TextParser对象,一遍逐块读取文件
chunksize文件块的大小,用于迭代
Ship_footer需要忽略的行数(从文件尾开始算起)
encoding文本编码格式

2. 文件保存

  • DataFrame.to_csv()
参数说明
path唯一必填参数,表示文件路径名、URL、文件型对象的字符串
sep用于对文件中各个字段进行拆分的字符序列或正则表达式,默认使用逗号作为分隔符
mode导出模式,‘w’为导出到新文件,‘a’为追加到现有文件末尾
index是否导出航索引,默认为True
header是否导出列索引,默认为True



希望能够对你有所帮助。

举报

相关推荐

0 条评论