数据为企业的发展提供动力。我们从数据中获取信息,对它们进行分析处理,然后生成更多的数据。每个应用程序都会产生数据,包括日志消息、度量指标、用户活动记录、晌应消息等。数据的点点滴滴都在暗示一些重要的事情,比如下一步行动的方向。我们把数据从摞头移动到可以对它们进行分析处理的地方,然后把得到的结果应用到实际场景中,这样才能够确切地知道这些数据要告诉我们什么。例如,我们每天在Amazon网站上浏览感兴趣的商品,浏览信息被转化成商品推荐,并在稍后展示给我们。这个过程完成得越快,组织的反应就越敏捷。花费越少的精力在数据移动上,就越能专注于核心业务。这就是为什么在一个以数据为驱动的企业里,数据管道会成为关键性组件。如何移动数据,几乎变得与数据本身一样重要。
Kafka最初是Linkedln的一个内部基础设施系统。我们发现,虽然有很多数据库和系统可以用来存储数据,但在我们的架构里,刚好缺一个可以帮助处理持续数据流的组件。在开发Kafka之前,我们实验了各种现成的解决方案,从消息系统到日志聚合系统,再到ETL工具,它们都无陆搞足我们的需求。最后,我们决定从头开发一个系统。我们不想只是开发一个能够存储数据的系统,比如传统的关系型数据库、键值存储引擎、搜索引擎或缓存系统,我们希望能够把数据看成是持续变化和不断增长的流,井基于这样的想主主构建出一个数据系统z事实上,是一个数据架构。这个想陆实现后比我们最初预想的适用性更广。Kafka一开始被用在社交网络的实时应用和数据流当中,而现在已经成为下一代数据架构的基础。大型零售商正在基于持续数据流改造他们的基础业务流程,汽车公司正在从互联网汽车那里收集和处理实时数据流,银行也在重新思考基于Kafka改造他们的基础流程和系统。
链接:https://pan.baidu.com/s/1gNeRJdNXBDBT_5tuQMeuwQ
提取码:7f3x
目录
第1章初识Kafka
第2章安装Kafka
第3章Kafka生产者一一向Kafka写入数据-
第4章Kafka消费者一一从Kafka读取数据
第5章深入Kafka
第6章可靠的数据传递
第7章构建数据管道
第8章跨集群数据镜像…
第9章管理Kafka
第10章监控Kafka
第11章流式处理