我公司的技术架构演化(二)性能优化

之前说到,我们的慢sql因为早期的程序员都很初级,因此,线上跑的慢sql满天飞;虽然做了DB隔离,把慢sql的影响局限在各自的微服务内,但还是要去解决。

当时的环境是,我们的业务迭代的速度非常疯狂,我们没有余暇去优化sql,甚至团队有能力优化的也没有几个,面对这个问题,我想到一个比较有趣的办法,做慢sql排名。

排名之前,是要做监控,我们通过druid收集sql的监控信息,把他们放到表里做排序,排序的规则是,按照出现次数 * RT时间来排;然后,我们只解决每天排名的TOP10,一年的时间,我们就几乎没有慢sql再出现了。

image.png

解决了慢sql的历史问题,那新出现的问题,我们怎么快速解决呢?我相信大多数的公司都会有慢接口报警、慢sql报警的,只是这些报警一般不大会有人看。在我以前的公司,一般都是运维童鞋定期会拉出一个长长的列表,在全公司层面发出来,让大伙去解决。

我们是怎么做的呢?答案是,日志接入钉钉。

通过钉钉的及时通信和提醒效果,第一时间触达给后端人员,再通过测试和后端共同的维护机制,保障每个慢sql都能被很及时的解决。

image.png

说到慢sql,有一个场景我要提一下,比如,突然某一个时段,我们发现接口出现了很高的RT延时,我们该如何排查呢?这里顺便给出一下我的排查思路。

  1. 先看慢接口,通过慢接口来确定是后端的哪个应用。
  2. 再去查找后端的应用,查看是否用运行异常,一般来说就看看ECS上的mem、cpu、网卡是否有飙升,如果这些都正常,再检查是不是FULL GC来引起的。
    1. 我的思路是,优先看那个时段有没有出现FULL GC,因为FULL GC的stw的时间很长,最长能超过1秒,一个健康的应用,一天内也不会出现一次full gc;young gc,一般来说按频率和时长来看,我的经验值是单次young gc最好不要超过100ms,1分钟尽量不要超过5次young gc。我们的jdk的版本是8,截图中你看到了元空间,因此它是G1。这里有些童鞋在问,JDK11已经有ZGC了,为什么不用11呢?答案是成本,我们不确定目前的中间件中有多少和jdk11是不兼容的,我们的ARMS(鹰眼-全链路监控)就不兼容,因此,盲目切换11带来的收益,远没有损失大。


      image.png
    2. 这里出道题,如果linux上发现系统资源都被一个java进程占用了,通过什么步骤能查到呢?(要把大象放冰箱,总共分几步呢?)

      1. top
      2. top -H
      3. printf "%x\n" 16进制异常线程号
      4. jstack 进程号|grep 16进制异常线程号 -A90
  3. 如果整体应用没有问题,服务器各项指标没有波动,那继续排查数据库,现在的阿里云的mysql(RDS)的监控已经做的非常好了,支持各种维度的性能监控、全量sql查看、慢sql查看&分析等。我的思路是,先查找有问题的那个时间段,再将那个时间段的全量sql进行统计排序,一般用耗时比例来看看是哪个sql占用了最多的资源(不一定占用资源最多的就是有问题的),再通过扫描行数,来看看是不是出现了不合理的sql。


    image.png

    image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,482评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,377评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,762评论 0 342
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,273评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,289评论 5 373
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,046评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,351评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,988评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,476评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,948评论 2 324
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,064评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,712评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,261评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,264评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,486评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,511评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,802评论 2 345

推荐阅读更多精彩内容

  • java动态网页技术 servlet 本质就是一段Java程序 在Servlet中最大的问题是,HTML输出和Ja...
    Liang_JC阅读 485评论 0 0
  • 我是黑夜里大雨纷飞的人啊 1 “又到一年六月,有人笑有人哭,有人欢乐有人忧愁,有人惊喜有人失落,有的觉得收获满满有...
    陌忘宇阅读 8,523评论 28 53
  • 信任包括信任自己和信任他人 很多时候,很多事情,失败、遗憾、错过,源于不自信,不信任他人 觉得自己做不成,别人做不...
    吴氵晃阅读 6,181评论 4 8
  • 怎么对待生活,它也会怎么对你 人都是哭着来到这个美丽的人间。每个人从来到尘寰到升入天堂,整个生命的历程都是一本书,...
    静静在等你阅读 4,957评论 1 6