0
点赞
收藏
分享

微信扫一扫

CDH高可用集群误删NameNode故障恢复

小北的爹 2022-09-21 阅读 38

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。


1.问题描述



在已启用HA的CDH集群中,误删Standby Namenode服务,导致集群异常,无法再次通过CM启用HA。异常如下


CDH高可用集群误删NameNode故障恢复_centos


2.问题复现



测试环境:

  • CDH5.11.2

1.一个健康集群并配置了HA

CDH高可用集群误删NameNode故障恢复_h5_02

CDH高可用集群误删NameNode故障恢复_h5_03


2.停止StandbyNameNode服务并删除

CDH高可用集群误删NameNode故障恢复_hive_04

CDH高可用集群误删NameNode故障恢复_centos_05


3.集群异常

CDH高可用集群误删NameNode故障恢复_centos_06


4.再次通过CM启用HA

CDH高可用集群误删NameNode故障恢复_h5_07

CDH高可用集群误删NameNode故障恢复_h5_08

集群无法再次启用HA,问题复现。


3.解决方法



1.向集群添加一个新的NameNode角色

CDH高可用集群误删NameNode故障恢复_centos_09

CDH高可用集群误删NameNode故障恢复_hive_10

新增NN角色

CDH高可用集群误删NameNode故障恢复_hive_11


2.添加完成NN后集群异常如下

CDH高可用集群误删NameNode故障恢复_hive_12


3.修改新增角色的配置如下

CDH高可用集群误删NameNode故障恢复_hive_13

CDH高可用集群误删NameNode故障恢复_h5_14

CDH高可用集群误删NameNode故障恢复_h5_15


4.保存以上修改的配置后,回到CM主页

CDH高可用集群误删NameNode故障恢复_centos_16

CDH高可用集群误删NameNode故障恢复_h5_17

CDH高可用集群误删NameNode故障恢复_hive_18

CDH高可用集群误删NameNode故障恢复_centos_19


5.重启完成集群恢复正常

CDH高可用集群误删NameNode故障恢复_hive_20



醉酒鞭名马,少年多浮夸! 岭南浣溪沙,呕吐酒肆下!挚友不肯放,数据玩的花!

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。




CDH高可用集群误删NameNode故障恢复_h5_21


举报

相关推荐

0 条评论