是什么
Apache Kafka® 是 一个分布式流处理平台
特性
- 可以让你发布和订阅流式的记录。这一方面与消息队列或者企业消息系统类似。
- 可以储存流式的记录,并且有较好的容错性。
- 可以在流式记录产生时就进行处理。
应用场景
- 构造实时流数据管道,它可以在系统或应用之间可靠地获取数据。
- 构建实时流式应用程序,对这些流数据进行转换或者影响。
总结
Kafka最适合的还是作为消息队列,处理流数据,给大量数据处理做一层缓冲。
前后对接,前面对接输入业务,后面对接可视化业务或者数据分析业务。
最常见的还是作为日志处理的一部分,参考阿里云版本的Kafka,详情见下图,也可以算是Kafka的最佳实践了。
参考资料
- https://kafka.apachecn.org/intro.html
- http://kafka.apache.org/intro
- https://help.aliyun.com/document_detail/68151.html?spm=a2c4g.11186623.6.545.65062cffVKdGJ6