文章目录
- Phoenix的介绍和客户端命令
- 构建HBase的二级索引
- 原始数据itcast_src构建二级索引
- phoenix 使用场景
- 车辆常用字段明细数据 ETL
- 车辆明细数据统计
- 车辆总数统计
- 车辆电量统计
- 车辆油耗统计
- 车辆速度统计
- 车辆数据统计意义分析
- Zeppelin简介
- zeppelin UI介绍
- zeppelin整合mysql
- zeppelin整合hive
- 车辆电量、速度数据统计报表
- 问题
Phoenix的介绍和客户端命令
- Phoenix的概念
- Phoenix on HBase 和 Hive on HDFS 的区别
- Phoenix 客户端命令操作及说明
- 查看表操作
① TABLE_SCHEMA
② 对应 HBase 的 namespace
- 创建表的操作
- 新增数据
- 查询操作
- 更新操作
- 删除操作
构建HBase的二级索引
- 为什么需要构建二级索引
- 索引的类型
①
概念:
创建:
查看:
删除:
②
概念:
创建:
查看:
删除:
③
概念:
创建:
查看:
删除:
④
概念:
创建:
查看:
删除:
- 本地索引和全局索引的比较
- 索引的优化
原始数据itcast_src构建二级索引
- 创建 HBase 表对应的 phoenix 表
- 创建 HBase 表对应的 phoenix 视图
phoenix 使用场景
车辆常用字段明细数据 ETL
- 常用字段
- 创建 HBase 车辆指标即席查询表
- 在 ETL 主任务中添加常用字段落地逻辑
- srcDataStream.addSink(new VehicleDetailSinkOptimizer(“itcastsrc_vehicle_detail”));
- 编写核心业务逻辑 实现 RichSinkFunction
private Put setDataSourcePut(ItcastDataObj itcastDataObj) {
//确定rowkey
String rowKey = itcastDataObj.getVin() + StringUtil.reverse(itcastDataObj.getTerminalTimeStamp().toString());
Put put = new Put(Bytes.toBytes(rowKey));
//设置需要写入的列有那些
//这两个列一定不为空,如果为空就不是正常数据了
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("vin"), Bytes.toBytes(itcastDataObj.getVin()));
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("terminalTime"), Bytes.toBytes(itcastDataObj.getTerminalTime()));
//电量百分比(currentElectricity)、当前电量(remainPower)、百公里油耗(fuelConsumption100km)、
// 发动机速度(engineSpeed)、车辆速度(vehicleSpeed)
if(itcastDataObj.getCurrentElectricity() != -999999D){
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("currentElectricity"), Bytes.toBytes(itcastDataObj.getCurrentElectricity()));
}
if(itcastDataObj.getRemainPower() != -999999D){
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("remainPower"), Bytes.toBytes(itcastDataObj.getRemainPower()));
}
if(StringUtils.isNotEmpty(itcastDataObj.getFuelConsumption100km()) ){
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("fuelConsumption100km"), Bytes.toBytes(itcastDataObj.getFuelConsumption100km()));
}
if(StringUtils.isNotEmpty(itcastDataObj.getEngineSpeed()) ){
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("engineSpeed"), Bytes.toBytes(itcastDataObj.getEngineSpeed()));
}
if(itcastDataObj.getVehicleSpeed() != -999999D){
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("vehicleSpeed"), Bytes.toBytes(itcastDataObj.getVehicleSpeed()));
}
put.addColumn(Bytes.toBytes(cf), Bytes.toBytes("processTime"), Bytes.toBytes(DateUtil.getCurrentDateTime()));
//返回put对象
return put;
}
- 在 phoenix 中创建车联指标即席查询明细视图
车辆明细数据统计
车辆总数统计
- 统计车辆明细总数
- 统计每天在线的车辆总数
车辆电量统计
- 统计车辆电量百分比
- 统计当前电量
车辆油耗统计
- 统计车辆百公里油耗
车辆速度统计
- 统计车辆发动机速度
- 统计车辆速度vehicleSpeed,求最大、最小、平均车速
车辆数据统计意义分析
Zeppelin简介
- zeppelin应用场景
- zeppelin安装介绍
zeppelin UI介绍
zeppelin整合mysql
zeppelin整合hive
车辆电量、速度数据统计报表
- 车辆电量统计报表
- 车辆速度统计报表
问题
- 如何删除topic并初始化数据
步骤:
1.检查 server.properties 配置文件中 delete.topic.enable=true,三台都要设置重启集群。
2.删除kafka中topic vehicledata
[root@node01 kafka]# bin/kafka-topics.sh --zookeeper node01:2181,node02:2181,node03:2181 --delete --topic vehicledata
# 使用 kafka-tools 客户端删除topic
3.打开 zkCli.sh 删除三组配置
rmr /brokers/topics/vehicledata
rmr /config/topics/vehicledata
rmr /admin/delete_topics/vehicledata
4.如果kafka集群没有关闭,关闭kafka集群
5.清空log.dirs=/export/data/kafka/kafka-logs目录就是kafka集群的数据目录
rm -rf /export/data/kafka/kafka-logs/*
6.重启kafka集群
7.创建topic vehicledata
[root@node01 kafka]# bin/kafka-topics.sh --zookeeper node01:2181 --create --topic vehicledata --partitions 3 --replication-factor 2