误删操作
rpm -qa | grep cloudera
rpm -e 依次卸载
本来我是删除测试集群的,删除完后一看,我去,卸载了线上的Cloudera Manager,吓死宝宝了,jps一看,还好Hadoop、Hive等服务还在,集群工作OK。这对我来说警告单距离我稍微远点。接下来赶紧想办法恢复。
恢复
看了一下CM官网的CM迁移,顿时感觉有点希望,然后参考它的步骤完成恢复。
Moving the Cloudera Manager Server to a New Host
主要步骤如下:
卸载CM(安装CM的命令)
停止内嵌数据库服务和CM Server服务
修改db.properties为自己外部数据库
启动CM Server和CM agent服务
问题
在恢复线上集群的时候,发现有机器的缺少/opt/cloudera/parcels文件夹,导致集群无法启动。
解决:将别的机器/opt/cloudera/parcels文件夹拷贝到相应路径,创建软连接即可。