监控系列讲座(十三)Prometheus复杂查询

学习目标

了解比较复杂的PromSQL查询

1. 简介

我们今天主要就是要通过一个非常复杂的例子来帮大家了解我们日常生产系统中的查询是怎样组成的。我们的例子来自于我曾经做过的一个报警指标,里面的都是一些表达式。我们挑选CPU作为我们今天的例子。

round((1 - avg(rate(node_cpu_seconds_total{mode="idle"}[15m])) by (instance)) * 100) > 80

这个指标里面涉及了我们几乎所有的知识点,他的主要目标是通过监控CPU空闲率来计算出现在CPU的繁忙程度,如果超过80%就需要报警了。

2. 查询

2.1. 查询普通的指标

如果我们只需要查询某一个指标的值,我们只需要把这个值放入查询框,此例中是node_cpu_seconds_total

image-20200725222816264.png
file

2.2. 选择(带标签的)查询

如果我们想选出某个标签等于特定值的结果,比如:mode=“idle”,就需要使用node_cpu_seconds_total{mode="idle"}

image-20200725222844802.png
file

2.3. 指定时间段

在指标的后面使用[15m]这种带时间参数的,就可以选出在15m之内的数值node_cpu_seconds_total{mode="idle"}[15m]

image-20200725222943122.png
file

感觉输出有点不太对劲啊,这是因为,如果要求一段时间内的值,这是需要使用一些修饰的,也就是rate和irate

2.4. rate和irate

rate结果如下

image-20200725223103669.png
file

irate结果如下

image-20200725223125141.png
file

irate和rate都会用于计算某个指标在一定时间间隔内的变化速率。但是它们的计算方法有所不同:irate取的是在指定时间范围内的最近两个数据点来算速率,而rate会取指定时间范围内所有数据点,算出一组速率,然后取平均值作为结果。

所以官网文档说:irate适合快速变化的计数器(counter),而rate适合缓慢变化的计数器(counter)。

根据以上算法我们也可以理解,对于快速变化的计数器,如果使用rate,因为使用了平均值,很容易把峰值削平。除非我们把时间间隔设置得足够小,就能够减弱这种效应。

2.5. 求平均值的函数

使用avg()函数可以求函数值,当然,我们还可以有其他的比如min(),max(),sum()等

image-20200725223308328.png

感觉结果又不太正确了,这是因为这边结果需要加上by,这和sql中的group by的道理是一样的,avg函数需要按照某一个by的字段进行求平均数

image-20200725223428061.png
file

2.6. 求出我们要的值

系统的使用是由很多部分组成的,但是空闲的部分缺只有一个,所以我们想得到系统使用率就用1减去空闲的百分比就是我们的系统使用率了,而不用再把每个使用CPU的指标相加。

image-20200725223746626.png
file

2.7. 优化

我们发现其实我们得出的结果往往是带小数的,比如0.8032,但是在实际的使用中,如果我们把指标定为0.8就报警,如果CPU有一些抖动就会影响报警了,所以我们使用100去乘以结果,得到80.32,然后使用round()函数去四舍五入得到整数,再去和80比较,就会得到一个整数去和80比较,看上去就比较清晰。

image-20200725223838650.png
file

为了方便大家学习,请大家加我的微信,我会把大家加到微信群(微信群的二维码会经常变)和qq群821119334,问题答案云原生技术课堂,有问题可以一起讨论

  • 个人微信
    640.jpeg

  • 腾讯课堂
    640-20200506145837072.jpeg

  • 微信公众号
    640-20200506145842007.jpeg

  • 专题讲座

2020 CKA考试视频 真题讲解 https://www.bilibili.com/video/BV167411K7hp

2020 CKA考试指南 https://www.bilibili.com/video/BV1sa4y1479B/

2020年 5月CKA考试真题 https://mp.weixin.qq.com/s/W9V4cpYeBhodol6AYtbxIA

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,133评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,682评论 3 390
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,784评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,508评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,603评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,607评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,604评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,359评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,805评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,121评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,280评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,959评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,588评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,206评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,442评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,193评论 2 367
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,144评论 2 352