1. ipc.client.connect.max.retries
和ipc.client.connect.retry.interval
参数设置的意义
防止出现journalnode服务ConnectException
详细可参考:https://blog.csdn.net/yhao2014/article/details/52426494
2. Hadoop参数大全:
https://blog.csdn.net/javastart/article/details/50349835
3. 正确的格式化Namenode的操作
- 执行
jps
,查看hadoop相关进程(Namenode,Datanode)是否存在,如果存在,停掉 - 删除日志文件目录(logs)和运行时产生的文件目录(data)
- 执行格式化Namenode命令(
hdfs namenode -format
)
为什么不能直接格式化Namenode?
格式化Namenode,会产生新的集群id,导致Namenode和Datanode的集群id不一致,集群找不到以往数据。
所以,格式化Namenode之前,一定要删除data数据和logs日志,然后再格式化Namenode。
Tips:如何查看集群ID?
-
方式1:在Web界面的首页查看
-
方式2:在Hadoop目录下查看