准备工作
准备三台服务器(hadoop129,hadoop130,hadoop131)
kafka集群依赖于zookeeper,需要先安装zookeeper集群
下载网址:http://kafka.apache.org/downloads.html
版本:kafka_2.11-0.11.0.0.tgz
安装部署
- 1)解压安装包
[bushro@hadoop129 software]$ tar -zxvf kafka_2.11-0.11.0.0.tgz -C /opt/module/
- 2)修改解压后的文件名称
[bushro@hadoop129 module]$ mv kafka_2.11-0.11.0.0/ kafka
- 3)在/opt/module/kafka目录下创建logs文件夹
[bushro@hadoop129 kafka]$ mkdir logs
- 4)修改配置文件
[bushro@hadoop129 kafka]$ cd config/
[bushro@hadoop129 config]$ vim server.properties
参数含义
#broker的全局唯一编号,不能重复
broker.id=0
#删除topic功能使能
delete.topic.enable=true
#处理网络请求的线程数量
num.network.threads=3
#用来处理磁盘IO的现成数量
num.io.threads=8
#发送套接字的缓冲区大小
socket.send.buffer.bytes=129400
#接收套接字的缓冲区大小
socket.receive.buffer.bytes=129400
#请求套接字的缓冲区大小
socket.request.max.bytes=131857600
#kafka数据路径
log.dirs=/opt/module/kafka/data
#topic在当前broker上的分区个数
num.partitions=1
#用来恢复和清理data下数据的线程数量
num.recovery.threads.per.data.dir=1
#segment文件保留的最长时间,超时将被删除
log.retention.hours=168
#配置连接Zookeeper集群地址
zookeeper.connect=hadoop129:2181,hadoop130:2181,hadoop131:2181
默认会创建一个logs目录来存放日志,不需要我们自己创建
log.dirs存放的是数据不是日志
- 5)配置环境变量
[bushro@hadoop129 module]$ sudo vim /etc/profile
#KAFKA_HOME
export KAFKA_HOME=/opt/module/kafka
export PATH=$PATH:$KAFKA_HOME/bin
[bushro@hadoop129 module]$ source /etc/profile
- 6)分发安装包
[bushro@hadoop129 module]$ xsync kafka/
注意:分发之后记得配置其他机器的环境变量
- 7)分别在hadoop130和hadoop131上修改配置文件
/opt/module/kafka/config/server.properties中的broker.id=1、broker.id=2
注:broker.id不得重复
- 8)启动集群
先启动zookeeper集群
然后依次在hadoop129、hadoop130、hadoop131节点上启动kafka
[bushro@hadoop129 kafka]$ bin/kafka-server-start.sh config/server.properties &
[bushro@hadoop130 kafka]$ bin/kafka-server-start.sh config/server.properties &
[bushro@hadoop131 kafka]$ bin/kafka-server-start.sh config/server.properties &
守护进程方式启动
- 9)关闭集群
[bushro@hadoop129 kafka]$ bin/kafka-server-stop.sh stop
[bushro@hadoop130 kafka]$ bin/kafka-server-stop.sh stop
[bushro@hadoop131 kafka]$ bin/kafka-server-stop.sh stop
集群启动脚本
case $1 in
"start"){
for i in hadoop129 hadoop130 hadoop131
do
echo *************$i kafka start************
ssh $i "/opt/module/kafka/bin/kafka-server-start.sh -daemon /opt/module/kafka/config/server.properties"
done
};;
"stop"){
for i in hadoop129 hadoop130 hadoop131
do
echo *************$i kafka stop************
ssh $i "/opt/module/kafka/bin/kafka-server-stop.sh /opt/module/kafka/config/server.properties"
done
};;
esac