0
点赞
收藏
分享

微信扫一扫

Kettle中的常用输入控件(一)

输入是转换中的第一个分类,也是转换中的第一大控件,主要的功能就是用来抽取数据或者生成数据,属于ETL中的E(extract)。

今天我们来了解一下CSV文件输入文本文件输入

一、CSV文件输入

展开输入目录,拉取csv文件输入到主窗口,双击图标,即可进行CSV文件输入的各项设置。

  1. 步骤名称:可以自定义任何名称,见名知意。
  2. 文件名:选择要输入的csv文件。
  3. 列分隔符:默认就是逗号,无须更改。
  4. 封闭符:结束行数据的读写。
  5. NIO缓存大小:文件如果行数过多,可通过调整此参数来设置缓存的大小。
  6. 包含列头行:指文件包含表头行,表头不进行读写。
  7. 行号字段:可以用来定义从某行开始读写,当表头行不止一行或者需要从某行开始读写数据时可进行设置。
  8. 并发运行?:选择并发,可提高读写速度。
  9. 字段中有回车换行?:不要选择,会将换行符当做数据读出。
  10. 文件编码:预览数据时如果出现乱码,可尝试更换文件编码。

二、文本文件输入

日志文件常常就是文本格式的,因此该控件可以用来处理日志文件,以下是文本文件输入的设置截图。

1、文件设置目录下,指定要输入的文本文件,指定完之后可点击添加,添加到选中的文件。

2、内容设置目录下,指定文本文件内容的分割符。

 

3、字段设置:点击获取字段,即可获取文件文件所有字段属性信息,按照需要进行调整修改。

 

4、数据预览:最后可点击数据预览看能否正常预览到数据。

今天就到这里吧!

 

宝宝累了。

举报

相关推荐

0 条评论