standby 节点报错 Encountered exception loading fsimage 加载fsimage时遇到异常

standby 节点报错
2020-12-27 10:36:38,662 INFO  common.Storage (Storage.java:tryLock(776)) - Lock on /export/hadoop/hdfs/namenode/in_use.lock acquired by nodename 35873@shyt-hadoop-4032.xx.com.cn
2020-12-27 10:36:38,665 WARN  namenode.FSNamesystem (FSNamesystem.java:loadFromDisk(726)) - Encountered exception loading fsimage
java.io.IOException: NameNode is not formatted.
    at org.apache.hadoop.hdfs.server.namenode.FSImage.recoverTransitionRead(FSImage.java:234)
    at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.loadFSImage(FSNamesystem.java:1077)
    at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.loadFromDisk(FSNamesystem.java:724)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.loadNamesystem(NameNode.java:697)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.initialize(NameNode.java:761)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:1001)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:985)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:1710)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:1778)
2020-12-27 10:36:38,669 INFO  mortbay.log (Slf4jLog.java:info(67)) - Stopped HttpServer2$SelectChannelConnectorWithSafeStartup@shyt-hadoop-4032.xx.com.cn:50070
2020-12-27 10:36:38,769 INFO  impl.MetricsSystemImpl (MetricsSystemImpl.java:stop(211)) - Stopping NameNode metrics system...
2020-12-27 10:36:38,770 INFO  impl.MetricsSinkAdapter (MetricsSinkAdapter.java:publishMetricsFromQueue(141)) - timeline thread interrupted.
2020-12-27 10:36:38,772 INFO  impl.MetricsSystemImpl (MetricsSystemImpl.java:stop(217)) - NameNode metrics system stopped.
2020-12-27 10:36:38,772 INFO  impl.MetricsSystemImpl (MetricsSystemImpl.java:shutdown(606)) - NameNode metrics system shutdown complete.
2020-12-27 10:36:38,772 ERROR namenode.NameNode (NameNode.java:main(1783)) - Failed to start namenode.
java.io.IOException: NameNode is not formatted.
    at org.apache.hadoop.hdfs.server.namenode.FSImage.recoverTransitionRead(FSImage.java:234)
    at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.loadFSImage(FSNamesystem.java:1077)
    at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.loadFromDisk(FSNamesystem.java:724)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.loadNamesystem(NameNode.java:697)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.initialize(NameNode.java:761)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:1001)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.<init>(NameNode.java:985)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.createNameNode(NameNode.java:1710)
    at org.apache.hadoop.hdfs.server.namenode.NameNode.main(NameNode.java:1778)
2020-12-27 10:36:38,774 INFO  util.ExitUtil (ExitUtil.java:terminate(124)) - Exiting with status 1
2020-12-27 10:36:38,775 INFO  timeline.HadoopTimelineMetricsSink (AbstractTimelineMetricsSink.java:getCurrentCollectorHost(278)) - No live collector to send metrics to. Metrics to be sent will be discarded. This message will be skipped for the next 20 times.

关键:Encountered exception loading fsimage 加载fsimage时遇到异常
排查路径
dfs.namenode.name.dir目录

解决问题:

方式 1 推荐

1、确保Active NameNode是正常工作,不要从Active NameNode节点/hadoop/hdfs/namenode目录下拷贝任何数据到Standby NameNode.
2、在Standby NameNode节点上执行
hdfs namenode -bootstrapStandby
Allows the standby NameNode's storage directories to be bootstrapped by copying the latest namespace snapshot from the active NameNode. This is used when first configuring an HA cluster.
该命令会恢复Standby NameNode节点的元数据
3、通过Ambari启动Standby NameNode
4、通过Ambari重启ZKFailoverController

方式 2

1、关闭整个集群,确认服务均已关闭
2、拷贝current数据至故障NN
scp -r root@xx.xx.40.32:/export/hadoop/hdfs/namenode/current .
3、授权
chown -R hdfs.hadoop current
4、删除/tmp 目录下的临时文件
5、重启集群

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 终极算法 关注微信号每天收听我们的消息终极算法为您推送精品阅读 前言 Hadoop 在大数据技术体系中的地位至关...
    Yespon阅读 130,494评论 12 168
  • 转自 吐血整理 | HDFS运维问题大全 https://zhuanlan.zhihu.com/p/1704789...
    专职掏大粪阅读 1,090评论 0 0
  • 一.HDFS概念及特性 首先,它是一个文件系统,用于存储文件,通过统一的命名空间——目录树来定位文件 其次,它是分...
    鄙人不善奔跑0阅读 286评论 0 0
  • 写在前面 我自己一直比较喜欢大数据这个方向的工作,虽然自己也在大数据相关的岗位上工作了小两年,但一直没有系统的学习...
    大数据学习宝典阅读 525评论 0 2
  • [TOC] 上一份工作主要负责大数据平台的建设,在这个过程中积累了一些Hadoop生态组件的搭建和使用笔记,由于时...
    西北偏北阅读 374评论 0 1