基于RabbitMQ的消息总线架构设计

初衷

为什么要设计消息总线(对消息队列进行二次封装),而不是让各业务系统直接使用RabbitMQ、Kafka、RocketMQ这样的成熟的消息队列呢?
如果业务系统比较简单,确实不需要考虑这样的问题,直接拿最成熟的开源方案是最好的方式,但是在复杂的多系统下、多人分工合作的场景下,直接使用成熟的消息队列一般都会面临以下问题

  1. 开发难度大,各系统间分别隔离,需要关注消息中间件的各种复杂繁琐的配置,关注不同的消息则需要对接不同的消息队列
  2. 维护成本高,各系统或团队需要分别管理消息中间件、处理各种服务异常、(消息中间件的高可用、业务的高可用等)
  3. 管理难度大,没法对消息的生产和消费进行业务管理,也不方便对消息中的敏感数据进行权限管理
  4. 扩展成本高,无法统一消息系统扩展功能,如路由、延时、重试、消费确认等
    总结消息队列是一个面向技术的接入,重点关注消息队列的配置、接口对接;而消息总线则是通过屏蔽部署、分组和通信等技术细节,实现一个面向业务的接入,重点关注要接收什么消息。

架构设计

消息总线屏蔽了消息发送、路由、分组、存储、消费负载、通信、高可用等一系列技术问题,对业务开发者来说只需要调用生产者或消费者SDK即可,简化了接入流程并提升了可靠性。
消息总线整体架构图如下图所示


基于RabbitMQ的消息总线架构
  • 生产者通过对接消息总线提供的SDK进行Publish消息
  • SDK充当消息队列Broker的角色,提供了消息路由、分组的功能、同时保证消息的高可用
  • 本设计以RabbitMQ作为消息引擎,在具体应用中也可以使用其他引擎如Kafka,具体路由策略可在SDK中配置
  • 消息的订阅关系可以存储在DB或者配置系统中
  • 消费者应用系统并没有直接对接RabbitMQ,而是使用Deliver服务集群来负责把AMQP协议转换为HTTP或RPC协议,然后将消息传递到相应业务系统,该方式可以支持多种架构如单体应用、SOA、微服务等

消息体

为保证消息在整个流程中减少复杂度,将消息体设计为如下统一结构


消息体设计
  • Header,通用数据,包含message ID、source、timestamp等参数
  • Payload,具体消息体,设计为json格式,便于阅读以及在跨系统、跨语言之间传输
  • Receiver,消息接收者,从订阅关系中获取,直接透传以提高效率

高可用

消息生产高可用

由于作为一个总线应用,会对接各种结构、语言、复杂度的系统,各系统的可靠性及处理能力差异较大,因此最直接想到的问题是各种类型的消息是否会相互干扰?

通过前面的介绍,可以了解到生产者发送的消息在经过Broker(SKD)时进行了路由、分组,具体策略如下:

  1. 多分组消息间:消息总线可根据业务、流量等维度进行物理隔离,保障各消息不会相互干扰
  2. 单分组消息内:在一个分组内消息总线可通过如下控制策略保障互不影响,具体设计如下


    分组内消息保护策略

消息经过Broker默认会进入一个RealTime Queue的队列中,Deliver集群中会有多个Listener监听RealTime Queue,在Deliver服务内,通过Dispatcher来控制消息并发及总数,当某种消息的发送量超过阈值时,就会触发处罚策略,将消息转发到Async Queue中,避免消费Worker都被同一个类型的消息占用,而Async Queue会被独立的Deliver服务监听进行消费,不影响RealTime Queue的消费,如果投递失败则会进入Retry Queue,满足一定条件后将会继续投递

消息消费高可用

为了保证消费时的高可用,Deliever集群在负责进行消费协议转换之外,也做了一些策略来保证消费端的高可用

  • 熔断,在消息一段时间内失败数据超过阈值时,停止对队列的消费,避免由于服务抖动或者线上故障引起的大面积消息消费失败
  • 自恢复,熔断后Deliver服务会对应用服务健康度进行监控,在服务恢复后可自动恢复消费
  • 自失败重试,消息总线服务发生故障时,可对期间的失败消息采用重试策略进行重试,避免由于基础服务问题造成的消费失败
  • 业务失败重试,在业务应用消费产生异常时,可在订阅消息时指定是否进行重试,消息总线会对需要失败重试的消息按照退避算法根据一定的时间间隔进行多次重试。
  • 优雅重启,Deliver可实现优雅重启和退出,保障当前正在消费的消息都处理完成后才退出进程。
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,451评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,172评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,782评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,709评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,733评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,578评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,320评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,241评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,686评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,878评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,992评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,715评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,336评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,912评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,040评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,173评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,947评论 2 355

推荐阅读更多精彩内容

  • 利用RabbitMQ集群横向扩展能力,均衡流量压力,让消息集群的秒级服务能力达到百万,Google曾做过此类实验;...
    有货技术阅读 3,468评论 0 1
  • http://liuxing.info/2017/06/30/Spring%20AMQP%E4%B8%AD%E6%...
    sherlock_6981阅读 15,914评论 2 11
  • 1.什么是消息队列 消息队列允许应用间通过消息的发送与接收的方式进行通信,当消息接收方服务忙或不可用时,其提供了一...
    zhuke阅读 4,467评论 0 12
  • 哈喽,大家好,我们都知道线程的重要性,其中线程间通信可以使得线程更加的灵活,所以我们这次来聊聊线程间是如何通信的。...
    Jevely阅读 250评论 0 2
  • 1、调动六感:不眨眼盯了20秒,闭眼眼前一片黑灰 2、眼球转动 3、快速阅读:10分钟,看了四遍,大概10% 4、...
    安妮妈812阅读 260评论 0 1