目录
- 脚本
- 说明
- 配置
写在前面
本文适合有python基础、使用过promethues + grafana的人
今天接到个任务,要监控后端的服务状态。
Prometheus有个不好的地方在于,在国内比较小众,模板不如zabbix那么丰富,网上的资料也很少。作为一个不想当咸鱼的运维,这种小(简)型(单)的exporter当然是要自己写啦。
Prometheus是使用pull的方式获取数据,于是自己用flask写了个接口监控后端服务的状态,并展示到grafana上。
安装依赖
yum -y install epel-release &&yum install python-pip -y&& pip install --upgrade pip &&pip install flask &&pip install prometheus_client
监控脚本
#!/bin/python
##coding=utf-8
import requests
import prometheus_client
from prometheus_client.core import CollectorRegistry
from prometheus_client import Gauge
from flask import Response,Flask
###定义函数,返回接口响应码
def StatusCode(url):
try:
url = url
response = requests.post(url)
return response.status_code
###加了个捕获异常,是因为如果后端服务挂掉的话,会报错connect refused。如果出现666,说明后端服务挂了
except:
return 666
muxCode = StatusCode('自己的监控的url')
manageCode = StatusCode('自己监控的url')
###起个flask接口
app = Flask(__name__)
####定义一个仓库,存放数据
REGISTRY = CollectorRegistry(auto_describe=False)
muxStatus = Gauge("mux_api_21","Api response stats is:",registry=REGISTRY)
manageStatus = Gauge("manage_api_21","Api response stats is:",registry=REGISTRY)
####定义路由
@app.route("/metrics")
def ApiResponse():
muxStatus.set(muxCode)
manageStatus.set(manageCode)
return Response(prometheus_client.generate_latest(REGISTRY),mimetype="text/plain")
if __name__ == "__main__":
app.run(host='0.0.0.0',port=3531)
说明
promethues有四种数据类型,具体的我就不介绍了,直接看官方文档:https://prometheus.io/docs/concepts/metric_types/
这里由于后端服务的返回码有可能是200,有可能是403、404等等,数据可能会变大变小,所以我选择了Gauge。
后台启动
nohup python api_statusCode.py > api_statusCode.out 2>&1&
验证下返回值
Prometheus.yml
在prometheus.yml文件末尾添加上,并重启Prometheus服务
- job_name: 'api_monitor'
scrape_interval: 5s
static_configs:
- targets: ['监控脚本所在服务器ip:3531']
labels:
group: 'api'
grafana添加dashboard
最后在grafana上添加个dashboard,再加上个告警就ok了。还是很简单的。