0
点赞
收藏
分享

微信扫一扫

实战:如何实时采集上亿级别数据?

承蒙不弃 2021-10-09 阅读 63
ELKkafka

背景介绍

采集流程

流程分解

流程一:MLSQL 消费MQ

流程二:通过Logstash进行消费MQ

流程三: 数仓建模

注意:本篇主要是借鉴这个需求讲解Logstash在实际场景中的使用以及优化,其他两个部分流程不做详细讲解

为什么这样设计?

原因一:

原因二:

Logstash开发流程

1.确定日志格式

2.调试grok

3.调试ruby

4.优化

1.MLSQL优化

2.Kafka端优化
3.hdfs优化
4.ES优化
举报

相关推荐

0 条评论