ES跨集群索引迁移(文件拷贝)

1. 说明

以文件拷贝方式跨集群迁移索引,会完整保留源集群上的索引的setting、mapping、aliase等所有完整配置,迁移过程中无法进行修改;

2. 源集群上备份索引

2.1 获取待迁移索引信息

包括索引setting、mapping、shard数量以及每个shard所在的节点信息;

获取索引信息

curl -XGET 'http://XX.XX.XX.XX:9200/_cat/indices/shakespeare?v'

health status index       uuid                   pri rep docs.count pri.store.size

green  open   shakespeare kEr6n5PJQ1COdhgXDpApnA   1   1     335901        202.6mb

获取索引相关的shard信息

curl -XGET 'http://XX.XX.XX.XX:9200/_cat/shards/shakespeare?v'

index       shard prirep state     docs   store ip           node

shakespeare 0     r      STARTED 335901 201.8mb 10.31.10.160 node-02

shakespeare 0     p      STARTED 335901 202.6mb 10.31.10.160 node-03

  可以看到待迁移的索引 song_proj_ae_20200304105959的id为kEr6n5PJQ1COdhgXDpApnA,有1个主分片,在节点10.31.10.160上,总文档数 335901,后续需要用到这些信息;

2.2 停止索引写入

索引备份之前,需要确保索引已经停止写入,最好停止索引写入的程序运行;

2.3 确保缓存写入磁盘

索引备份之前,需要确保缓存中的索引数据已经保存在磁盘上,否则会发生数据丢失,使用如下命令,强制缓存中的所有数据写入磁盘,待命令执行成功后继续下一步;

curl -XPOST "http://XX.XX.XX.XX:9200/shakespeare/_flush/synced"

2.4 备份索引

根据第一步上获取到的索引的每个分片的节点信息,登陆到对应的节点上对应的索引目录下,将索引uuid的目录,完整进行备份操作。

/opt/huawei/data2/nodes/0/indices/kEr6n5PJQ1COdhgXDpApnA

drwx------ 5 es users 4096 Mar  4 11:37 0

drwx------ 2 es users 4096 Mar  4 12:06 _state

scp -r kEr6n5PJQ1COdhgXDpApnA XX.XX.XX.XX:/opt/huawei/data_bak/shakespeare/0/

建议:如果源集群和目的集群之间的网络是互通的,可以直接两台机器之间直接拷贝;

2.5 多分片的备份方式

如果索引中包含多个主分片,并且分片分布在不同的服务器上,则需要分别备份到备份服务器上,不可以人为进行合并;

建议:有条件的话,可以将多个分片通过reroute的move命令,移动到同一个节点上,可以简化备份和恢复操作;

3. 目的集群上恢复索引

3.1 准备

恢复索引就是从备份服务器上,将备份的索引恢复到新集群的Datanode节点上,恢复过程中需要的Datanode节点的数量,和源集群上索引分布的Datanode节点数量相等,即如果索引只有1个分片,或者所有分片都集中在1个Datanode节点,则只需要恢复到1个Datanode节点即可,如果索引有4个分片,分布到3台Datanode上,则需要分别恢复到新集群上的3台Datanode上,依次类推;

3.2 恢复索引文件

下面以恢复一个索引的一个分片为例进行说明:

登陆到新集群的一台Datanode服务器上,进入ES Data目录下的indices子目录下,参考 /opt/huawei/data/nodes/0/indices;

从备份服务器上,将需要恢复索引的对应索引目录复制到该目录下。

cd /opt/huawei/data/nodes/0/indices/

cp -r /opt/huawei/data_bak/shakespeare/0/kEr6n5PJQ1COdhgXDpApnA/ .


[es@host-10-33-114-216 kEr6n5PJQ1COdhgXDpApnA]$ ll

drwx------ 4 es es 4096 Mar  5 17:07 0

drwx------ 2 es es 4096 Mar  5 17:01 _state

可以看到,此处的整个索引目录,都是从源索引的备份目录中获取来的;

[es@host-10-33-114-216 kEr6n5PJQ1COdhgXDpApnA]$ cd 0

[es@host-10-33-114-216 0]$ ll

total 8

drwx------ 2 es es 4096 Mar  5 17:07 index

drwx------ 2 es es 4096 Mar  5 17:01 _state

drwx------ 2 es es 4096 Mar  5 17:07 translog

3.3 加载索引

待索引的所有分片,都已经拷贝到对应的Datanode服务器上时,再进行索引加载操作;

当集群状态发生变化时,ES集群会自动发现并加载新索引,可以通过重启节点、创建/删除索引、调整副本数等方式触发集群状态刷新,建议可以通过触发ES集群自动修复来进行集群状态刷新;

curl -XPOST "http://XX.XX.XX.XX:9200/_cluster/reroute?retry_failed=true"

集群状态刷新后,依次检查索引状态和分片状态,可以看到对应索引的状态已经变成GREEN,并且分片的状态已经变成 STARTED,恢复正常;

curl -XGET 'http://XX.XX.XX.XX:9200/_cat/indices/shakespeare?v'

health status index       uuid                   pri rep docs.count pri.store.size

green  open   shakespeare kEr6n5PJQ1COdhgXDpApnA   1   1     335901        202.6mb

curl -XGET 'http://XX.XX.XX.XX:9200/_cat/shards/shakespeare?v'

index       shard prirep state     docs   store ip            node

shakespeare 0     p      STARTED 335901 201.8mb 10.33.114.216 node-01

至此,该索引的数据已经恢复,如果有多个索引需要恢复,可以重复执行以上步骤;

4. 常见问题

4.1 当索引已经迁移到新集群中后,如果通过手工删除后,再次采用该方式无法迁移

原因:ES中自动识别索引,是通过索引名称和uuid来唯一确定的,虽然该索引已经删除,但是在ES集群中的信息已经将该索引标记为删除状态,无法再次通过自动识别进行迁移;

解决方法:需要将源索引改名后重新迁移;

4.2 当索引有多个分片,只迁移了部分分片进行恢复后,索引状态为RED

原因:当只迁移了部分分片就恢复时,由于ES找不到其他未迁移的分片,导致索引状态为RED;

解决方法:将未恢复的分片拷贝到某个datanode节点上,再通过 allocate_stale_primary 命令,强制恢复;

shard为准备恢复的shard id,node表示在该节点上已经存在该shard的数据,index为索引名称;

curl -XPOST "http://127.0.0.1:9200/_cluster/reroute" -H "Content-Type: application/json" -d '{

   "commands": [

       {

           "allocate_stale_primary": {

               "index": "shakespeare",

               "shard": 0,

               "node": "node-01",

               "accept_data_loss": true

           }

       }

   ]

}'

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,194评论 6 490
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,058评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,780评论 0 346
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,388评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,430评论 5 384
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,764评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,907评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,679评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,122评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,459评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,605评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,270评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,867评论 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,734评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,961评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,297评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,472评论 2 348

推荐阅读更多精彩内容