一、数据导入
1、向表中装载数据(load)
案例:
1)创建一张表
2)加载本地文件到hive
3)加载hdfs文件到hive
4)加载数据覆盖表中已有数据
2、通过查询语句向表中插入数据(insert)
1)创建一张分区表
2)基本插入数据
3)基本模式插入(根据单张表查询结果插入)
4)多插入模式(根据多张表查询结果)
3、查询语句中创建表并加载数据(As select)
根据查询结果创建表(查询结果会添加到新创建的表中)
4、创建表时通过location指定加载数据路径
1)创建表,并指定在hdfs上的位置
2)上传数据到hdfs上
5、import数据到指定的hive表中(注意:先用 export 导出后,再将数据导入)
二、数据导出
1、insert导出
1)将查询结果导出到本地
2)将查询结果格式化导出到本地(使得数据分割之间更加明显)
3)将查询结果导出到hdfs上(没有local)
2、hadoop命令导出到本地
3、hive shell 命令导出
4、export导出到hdfs上
清除表中的数据(truncate)
注意:Truncate 只能删除管理表,不能删除外部表中数据