问题:
部分主机宕机后,CDH集群启动成功,但是有某些主机提示“无法找到主机的NTP 服务,或该服务未响应时钟偏差请求”
解决步骤:
1.先同步服务器时钟
执行命令:
service ntpd stop 停止ntp服务
ntpdate 主机ip 同步主机时钟
service ntpd start 启动ntp服务
service ntpd status 查看服务启动情况
ntpq -pn 查看同步的服务器IP
ntpstat 查看同步结果
2.在CDH界面停止主机上的角色
3.进入该主机的CDH安装目录执行 ./cloudera-scm-agent restart (即需要在问题主机上重启cloudera-scm-agent服务)
目录在etc/init.d下
4.等待CDH界面刷新,问题解决,大概等3 5分钟就看不到时钟偏差问题了。
解决思路:
1.同步服务器时钟是为了确定是否是ntp服务本身的问题。
2.发现服务器时钟没有问题,所以不是ntp服务本身的问题。
其中这句话说,如果该命令失败、NTP 未与服务器同步,或主机的 NTP 后台程序未运行或无法联系,该测试将返回运行状况“不良”。
所以可能是CDH集群本身没有接收到时间同步服务器的结果,于是执行重启agent的命令。至此问题解决!