《一起学mongodb》之第二卷部署模式(一)

微号：「moon聊技术」
关注选择“ 「星标」 ”，重磅干货，第一时间送达！
[如果你觉得文章对你有帮助，欢迎「关注，在看，点赞，转发」]

前言

上一篇跟大家简单的介绍了一下 mongoDB 的特点，做了一个简单的入门，不知道大家是否还记得，不记得的小伙伴可以回顾一下《一起学》mongodb 之第一卷

今天就主要和大家来聊一聊 「mongoDB 的单点模式、主从模式和副本集模式」，分片集群由于也是很重点一块儿，并且内容较多，我会把他放在下一篇内容和大家聊聊

单机模式

第一种模式也叫做单机模式，它「是最基本的一种模式」，无数的数据库的雏形都是这种方式。

这种部署方式只含有一个 mongod 实例。这种部署方式最简单，但是它并没有数据备份，一旦该节点出现故障，很难快速切换到其他节点，当数据损坏的时候可能会丢失数据，一般不建议采用这种方式。

主从模式

「master」:主节点，负责数据的读写工作
「slave」:从节点，只负责数据的读工作

image

主从模式也是集群部署中最常见的方式之一，比如 mysql，redis 都支持主从的部署方式，「主要用于备份，故障恢复，读扩展，读写分离」.

image

「主从同步流程：」

1.主节点接受用户的写请求，更新用户表和oplog表。「如果用户设置了 writeConcern 属性」，则可能开启了写确认，处理线程可能会阻塞
2.从节点上的后台线程到主节点上「获取 oplog」，并「放入到 OplogBuffer中」
3."replBatcher" 「从 OplogBuffer 中消费并保存到 OpQueue 中」
4."OplogApplier" 线程通过多个（默认16个）worker 线程「从 OpQueue 获取数据并回放 Oplog」，并更新 lastAppliedOpTime 和 lastDurableOpTime
5.从节点上的后台线程感知到有新数据写入成功，「将自身最新的 lastAppliedOpTime和lastDurableOpTime 等信息返回给主节点」
6.主节点「接受」到各个从节点最新的 「lastAppliedOpTime 和 lastDurableOpTime」，计算大多数节点当前的数据同步进展，并「更新 lastCommittedOpTime」, 然后唤醒正在等待的请求处理线程主节点上的用户处理线程给用户返回处理结果

image

总的来说，mongoDB 的 slave 节点之间是无感知的，在 master 收到写请求后，会将该信息「写入到 oplog」 中，「oploog 是一个固定大小的文件」，slave 会「定时拉取 oplog」，来完成数据的同步，这是属于「增量同步」

当然还有两种情况是全量同步

新 slave 节点进入
slave 节点数据落后太多(slave 节点的最新数据时间戳小于 oplog 最老数据的时间戳)

mongoDB 主从模式的特点:

Master-Slave 的角色是静态配置的，不能自动切换角色，必须人为指定；
用户只能写 Master 节点，Slave 节点只能从 Master 拉数据；
Slave 节点只和 Master 通信，Slave 之间相互不感知，
读写分离

image

缺点：

系统明显存在单点，那么多 Slave 只能从 Master 拉数据，而无法提供自己的判断；
在主从模式下如果 master 挂了，「只能手工完成故障恢复，无法自动完成故障转移」
可用性差。因为主节点挂掉的时候，必须要人为操作处理
短期的数据不一致问题，对于必须需要数据强一致的场景是不合适这种读写分离的
master 同步压力较大，slave 都要从 master 去同步

副本集模式

我们前面说到了主从模式的一系列缺点，那么副本集模式就是优化了它的一系列缺点

我们先来介绍一下副本集模式

image

副本集模式的角色除了 「master(也可以叫做 primary)」 和 「slave(也可以的叫做 Secondary)」 之外，还多了一个 「arbiter」(仲裁者)，仲裁节点「没有数据集的副本」，并且「不能成为主节点」。然而，仲裁节点「可以参与主节点选举」。一个仲裁节点只有 1 票选举权。

选举 master

slave 之间会间歇性的「发送心跳包来维护各个节点的信息」，节点根据自己的集群状态判断是否需要更新新的 primary。在实现的时候主要由两个异步的过程分别处理心跳响应和超时，每个复制集成员都会在后台运行与复制集所有节点的心跳线程，在以下几种情况下会触发状态检测过程：

slave 节点权重(Priority)比 master 节点高
slave 节点发现集群中没有 master 时
master 节点不能访问到大部分成员时主动降级，降级操作会断开连接，终止用户请求
复制集成员心跳检测结果发生变化，比如某个节点挂了或者新增节点，发起重新投票选举规则
超过4s没有执行状态检测过程

「选举发起」 发起选举的节点首先需要做一些条件判断，维护主节点的有 N 个备用节点，备用节点中的所有节点都可能被选举成为主节点，成为主节点前每个备节点都会检测自身以及全局条件是否满足，检测条件如下：

是否看见复制集中是否有 majority 在线
priority 是否大于0
不为 arbiter
同步进度不能落后于最新节点 10s 以上
存储的集群信息为最新

如果所有条件满足，则将自身添加到主节点的备用列表中，否则，将自身从列表中移除

「自身检测」

MongoDB 选举需要获得大多数投票才能通过，如果没有节点投反对票，且获得成票数超过有权投票节点总数的1/2，则能成为 Primary。否则进入下一轮选举。为避免陷入无限重复选举，MongoDB 建议复制集的成员个数为奇数，当 Secondary 为双数时，可以增加一个 Arbiter 节点。
选举过程中，复制集没有主节点，所有成员都是只读状态
选举过程很复杂，一般情况下需要 5s 左右进行选主。
如果新选择的主节点立刻挂掉，至少需要 30s 时间重新选主。

同步数据

image

「初始化同步源的选择」（全量）

初始化同步源的选择取决于启动参数 「initialSyncSourceReadPreference」：

primary （禁用级联后的默认值），则选择主节点作为同步源。如果主服务器不可用或无法访问，则记录错误并定期检查主服务器的可用性。
primaryPreferred，则优先尝试选择主节点作为同步源。如果主节点不可用或者无法访问，则将从剩余可用的副本集成员中选择同步源。
secondary:操作只能从集合的次要成员中读取。如果没有可用的辅助节点，则此读取操作会产生错误或异常。
secondaryPreferred:在大多数情况下，操作从辅助成员中读取，但在该集合由单个主成员（并且没有其他成员）组成的情况下，读取操作将使用副本集的主成员。
nearest （启用级联后的默认值），则从副本集成员中选择网络时延最小的节点最为同步源。

执行初始化同步源选择的成员将「会遍历所有副本集成员的列表两次」：

第一次遍历
- 当为选择复制同步源进行第一次遍历时，执行同步源选择的成员将检查每个副本集成员是否满足如下条件：
- 同步源必须处于 PRIMARY 或者 SECONDARY 的复制状态。
- 同步源必须是在线且可访问的。
- 同步源必须比该成员具有更新的oplog条目（即同步源数据同步领先于该成员）。
- 同步源必须是可见的。
- 同步源必须和主节点最新的oplog条目同步时间相差在30s之内。
- 如果该成员是可创建索引的，则同步源也必须可创建索引。
- 如果该成员可参与副本集选举投票，则同步源也必须具有投票权。
- 如果该成员不是一个延迟成员，则同步源也不能是延迟成员。
- 如果该成员是一个延迟成员，则同步源必须配置一个更短的延迟时间。
- 同步源必须比当前最好的同步源更快(即更低的时延)。
- 「如果第一次遍历没有产生候选的同步源，则该成员会用更宽松的条件进行第二次遍历。请参考同步源选择」第二次遍历。
第二次遍历
- 当为选择复制同步源进行第二次遍历时，执行同步源选择的成员将检查每个副本集成员是否满足如下条件：
- 同步源必须处于 PRIMARY 或者 SECONDARY 的复制状态。
- 同步源必须是在线且可访问的。
- 如果该成员是可创建索引的，则同步源也必须可创建索引。
- 同步源必须比当前最好的同步源更快(即更低的时延)。
- 「如果该成员在两次遍历后依然无法选择出初始同步源，它会记录报错并在等待1s后重新发起选择的过程」

复制同步源的选择 (增量)

复制同步源的选择取决于副本集参数 chaining 的设置：

启用后从副本集成员间执行同步源选择。
禁用后选择主节点作为复制源。

执行复制同步源选择的成员将会「遍历」所有副本集成员的列表「两次」：

同步源选择（第一次） - 当为选择复制同步源进行第一次遍历时，执行同步源选择的成员将检查每个副本集成员是否满足如下条件： - 同步源必须处于 PRIMARY 或者 SECONDARY 的复制状态。 - 同步源必须是在线且可访问的。 - 同步源必须比该成员具有更新的oplog条目（即同步源数据同步领先于该成员）。 - 同步源必须是可见的。 - 同步源必须和主节点最新的oplog条目同步时间相差在30s之内。 - 如果该成员是可创建索引的，则同步源也必须可创建索引。 - 如果该成员可参与副本集选举投票，则同步源也必须具有投票权。 - 如果该成员不是一个延迟成员，则同步源也不能是延迟成员。 - 如果该成员是一个延迟成员，则同步源必须配置一个更短的延迟时间。 - 同步源必须比当前最好的同步源更快(即更低的时延)。

如果「第一次遍历没有产生候选的同步源」，则该成员会用更宽松的条件「进行第二次遍历」

同步源选择（第二次遍历） - 当为选择复制同步源进行第二次遍历时，执行同步源选择的成员将检查每个副本集成员是否满足如下条件： - 同步源必须处于 PRIMARY 或者 SECONDARY 的复制状态。 - 同步源必须是在线且可访问的。 - 如果该成员是可创建索引的，则同步源也必须可创建索引。 - 同步源必须比当前最好的同步源更快(即更低的时延)。 - 如果该成员在两次遍历后依然无法选择出初始同步源，它会记录报错并在等待1s后重新发起选择的过程。

image

MongoDB通过使用「多线程批量应用写操作来提高并发」。MongoDB根据文档 id 进行分批，同时使用不同的线程应用每组操作。MongoDB总是「按照原始的写顺序对给定的文档应用写操作」。

image

「选择从从节点复制数据就叫做链式复制」，

链式复制带来的「好处」是：

不用所有从节点都到主节点同步数据，可以有效减少主节点的压力。
对于写完主节点即返回，并读主节点的业务来说，开启链式复制能在一定程度上提升性能。

链式复制带来的「缺陷」是：

数据复制的链路变长。对于 WriteConcern 设置比较大的请求，处理时长会变长。
读oplog的压力从主节点转移到了部分从节点上，会一定程度上影响从节点的性能。

流控制

image

我们知道磁盘文件级别的「读写操作是不能进行」的，所以也就是说，当 mongoDB 收到大量的写请求写入 oplog 后，由于数据量大，则从节点拉取 oplog 可能会造成长时间阻塞，那么就有可能造成「主从不一致」的显现出现

mongoDB 为了减少「主从不一致」这种情况，从 MongoDB 4.2 开始，管理员可以「限制主节点应用其写操作的速度」，目的是将大多数提交延迟保持在可配置参数的最大值之下，从而保证主从之间的一致性。

总结

看完了上述的内容，你应该要知道 「mongoDB 单机、复制、副本集三种模式的区别，主从同步流程，日志同步技术，为什么会有流控制，初始化同步和增量同步是怎么做的?」

其实除了这三种方式以外，还有第四种部署方式-「分片集群」，但是由于分片集群的内容比较多，所以我就放到下一章单独去讲了，下一章见~~

「喜欢的朋友可以给 moon 来个星标，有文章都会第一时间推送给你，点击下方moon 的公众号，关注后右上角点开就可以了看到了，欢迎大家一起讨论」

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 207,113评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,644评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 153,340评论 0赞 344
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,449评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,445评论 5赞 374
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,166评论 1赞 284
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,442评论 3赞 401
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,105评论 0赞 261
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,601评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,066评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,161评论 1赞 334
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,792评论 4赞 323
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,351评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,352评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,584评论 1赞 261
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,618评论 2赞 355
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,916评论 2赞 344

《一起学mongodb》之第二卷部署模式(一)

前言

单机模式

主从模式

副本集模式

选举 master

同步数据

「初始化同步源的选择」（全量）

复制同步源的选择 (增量)

流控制

总结

推荐阅读更多精彩内容