0
点赞
收藏
分享

微信扫一扫

【排错】node not found


我遇到过几种情况报这个错,简单分享下

1、集群初始化后,节点主机名变更,重启kubelet后报这个错

解决:

修改回原来的主机名,重启kubelet,正常

2、主机名不识别,我们一般用的可能都是短名,比如master1、master2、worker1等

解决:

其他主机解析不了这个主机名,需要加入/etc/hosts里面

3、etcd集群起不来,导致apiserver也起不来,整个集群不可用

起因:

内部harbor域名由hub.xxx.cn变更为hub.yyy.com
我修改了/etc/docker/daemon.json后重启docker,kubelet后,报错开始

现象:

kubectl命令无法使用,apiserver没有起来,日志报错node \"xxx\" not found
上面两个步骤检查了,也不行

分析:

#1、在修改hub.eswin.cn域名为hub.eswincomputing.com时,重启master1的docker及kubelet后,导致报错找不到节点
#2、查看/etc/hosts文件,配置错误,更正后,还是不行
#3、查看apiserver是否自动,无限重启中
#4、查看etcd是否正常,结果etcd无法选主,查看日志有镜像pull不下来,修改后,重启另外两个master节点kubelet几次后可以了
#5、最后定位为etcd集群没有起来,导致apiserver也没起来,最主要的还是/etc/docker/daemon.json文件修改的不对
# 配置为hub.yyy.com后,该节点无法解析,镜像下载不下来,所以etcd起不来,应该同时配置"hub.xxx.cn","hub.yyy.com",这样不会影响到原来的域名使用。


举报

相关推荐

0 条评论