输入是转换中的第一个分类,也是转换中的第一大控件,主要的功能就是用来抽取数据或者生成数据,属于ETL中的E(extract)。
今天我们来了解一下CSV文件输入和文本文件输入。
一、CSV文件输入
展开输入目录,拉取csv文件输入到主窗口,双击图标,即可进行CSV文件输入的各项设置。
- 步骤名称:可以自定义任何名称,见名知意。
- 文件名:选择要输入的csv文件。
- 列分隔符:默认就是逗号,无须更改。
- 封闭符:结束行数据的读写。
- NIO缓存大小:文件如果行数过多,可通过调整此参数来设置缓存的大小。
- 包含列头行:指文件包含表头行,表头不进行读写。
- 行号字段:可以用来定义从某行开始读写,当表头行不止一行或者需要从某行开始读写数据时可进行设置。
- 并发运行?:选择并发,可提高读写速度。
- 字段中有回车换行?:不要选择,会将换行符当做数据读出。
- 文件编码:预览数据时如果出现乱码,可尝试更换文件编码。
二、文本文件输入
日志文件常常就是文本格式的,因此该控件可以用来处理日志文件,以下是文本文件输入的设置截图。
1、文件设置目录下,指定要输入的文本文件,指定完之后可点击添加,添加到选中的文件。
2、内容设置目录下,指定文本文件内容的分割符。
3、字段设置:点击获取字段,即可获取文件文件所有字段属性信息,按照需要进行调整修改。
4、数据预览:最后可点击数据预览看能否正常预览到数据。
今天就到这里吧!
宝宝累了。