监控系列讲座(十八)Thanos的概念与组件

1. 架构

我们先来看看官方架构图

arch.jpg
file
  • 黄色的部分是prometheus,exporters和alertmanager的三大组件,是prometheus最原始的架构
  • 蓝色的部分中:Thanos Sidecar和Thanos Query就是我们上节课搭建的那两个组件
  • 深灰色的是存储部分,其中,Thanos ruler和Thanos Sidecar使用的是本地硬盘(其实也可以存储到对象存储上,但是没什么必要),而Thanos Storage Gateway和Thanos Compact可以去对象存储中获取数据。
  • Thanos Storage Gateway:我们在上一节课程中看到了,启动时候的参数--store 127.0.0.1:19190,这个是sidecar暴露出来的gRPG的API接口,不是Storage Gateway,如果想要使用别的存储,需要使用thanos store命令,并且指定配置文件的位置,使用--objstore.config-file,我们后面讲集成存储的时候再说。
  • Thanos Compact:他的作用是优化查询历史数据时候的查询速度。
  • Ruler:和Prometheus的ruler差不多,也是通过调用alertmanager来发送报警的

2. 安装和配置所有的组件

2.1. 准备对象存储

在我们正式安装所有的组件之前,我们还需要安装另外一个组件,这个组件thanos并不提供,他需要借助其他解决方案。官方给出的方案有下面几种

image-20200911172122008.png
file

我们可以看到目前稳定版本的依然是公有云三大巨头,而中国在这方面也不甘落后,阿里和腾讯都有支持,但是都是Beta版本。为了效果更好,我们使用另外一个开源方案,MinIO。这是一个开源的项目,他可以兼容S3协议,连接方式也和S3一样的。我们后面讲分布式存储的时候会说他,其他任何的软件,只要是支持持久存储到s3,我们都可以使用MinIO来替代。我们的体系中还有另外一个项目要使用到MinIO,那就是Spinnaker。

这里我们使用非常简单的方式启动一个S3

docker run -p 9000:9000 --name minio \
  -e "MINIO_ACCESS_KEY=AKIAIOSFODNN7EXAMPLE" \
  -e "MINIO_SECRET_KEY=wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY" \
  -v /mnt/data:/data \
  -v /mnt/config:/root/.minio \
  minio/minio server /data

起来之后就可以看到图形界面了,而在启动时候的两个key和AWS上的两个KEY作用一样,后面配置文件需要用到。

image-20200913225005302.png
file

我们创建一个bucket,叫thanos

2.2. Sidecar

在容器时代非常常见的一种扩展容器的方式,如果把thanos部署在容器当中,那么sidecar组件就要部署为sidecar形式。sidecar的作用有两个

  • 把prometheus的数据备份到对象存储中
  • 为Thanos的其他组件提供一个可以访问prometheus的接口,这个接口是使用gRPC API的

注意:如果想让Sidecar可以重新加载Prometheus节点,记得要在prometheus启动的时候加上--web.enable-lifecycle选项

2.2.1. 启动参数

如果使用命令直接启动的话使用下面的配置

thanos sidecar \
    --tsdb.path            /var/prometheus \          # 需要指定prometheus的数据文件地址
    --prometheus.url       "http://localhost:9091" \  # 暴露查询API的地址
    --objstore.config-file bucket_config.yaml \       # 对象存储的信息

部署这个对于prometheus来说,基本不会有任何的影响。同时,他还可以起到备份的作用,如果我们不想备份,就不需要--objstore.config-file选项了。

2.2.2. Store API

Sidecar组件还包含了一个Store API,他暴露为gRPG形式的,可以让我们查询到存储在Prometheus中的metrics数据。在刚才的基础上,我们的sidecar参数就会扩展为

thanos sidecar \
    --tsdb.path                 /var/prometheus \
    --objstore.config-file      bucket_config.yaml \
    --prometheus.url            http://localhost:9090 \
    --http-address              0.0.0.0:19191 \ # 这个是用来查询sidecar中的数据的
    --grpc-address              0.0.0.0:19090   # 这个是用来查询prometheus中的数据的

2.2.3. 上传以前的metrics

如果需要上传以前的数据,我们需要使用--shipper.upload-compacted选项,他会把所有的prometheus的数据都上传(从prometheus启动之后的,存储在本地硬盘上的数据都上传)。而且删除的时候需要手动删除,除非我们需要验证从前的数据,否则一定要慎重打开这个选项。

2.2.4. External Labels

prometheus中允许配置external labels。这样就可以定义它在全局中的角色了。由于Thanos的目的是为了整合不同实例中的数据,所以定义external label就变得至关重要。

比如,在我们的prometheus中就可以这样定义

global:
  external_labels:
    region: eu-west
    monitor: infrastructure
    replica: A

2.3. Querier/Query

2.3.1. 启动选项

我们为一个或者多个Prometheus实例配置的Sidecar之后,我们就可以使用query组件来通过PromQL查询来同时查询所有的metrics。

这个组件是无状态的,可以水平扩展的,他可以部署任意的副本,一旦连接上Sidecar之后,他会自动的检测哪个Prometheus服务器需要被连接来做查询。

Query同样使用Prometheus官方的HTTP接口,因此他同样支持外部工具,比如Grafana。他还同时提供了一个类似于Prometheus的界面来查询和存储状态。

我们可以这样启动一个Query

thanos query \
    --http-address 0.0.0.0:19192 \ # 图形界面的地址
    --store        1.2.3.4:19090 \ # 静态gRPC地址,用于查询
    --store        1.2.3.5:19090 \ # 还可以设置多个
    --store        dnssrv+_grpc._tcp.thanos-store.monitoring.svc #还支持dns的方式暴露

2.3.2. 对Prometheus集群架构中的数据进行去重

刚才在sidecar中说到了external_label,这里对于集群的角色分类,就是靠的这个标签。我们刚才配置了一个标签

global:
  external_labels:
    region: eu-west
    monitor: infrastructure
    replica: A

这里我们就针对replica来去重,使用--query.replica-label参数

thanos query \
    --http-address        0.0.0.0:19192 \
    --store               1.2.3.4:19090 \
    --store               1.2.3.5:19090 \
    --query.replica-label replica
    --query.replica-label replicaX 

2.3.3. 不同组件的通信

不同节点间通信的唯一渠道就是我们的gRPC storeAPI。我们通常会这样配置

thanos query \
    --http-address 0.0.0.0:19192 \
    --grpc-address 0.0.0.0:19092 \
    --store        1.2.3.4:19090 \
    --store        1.2.3.5:19090 \
    --store        dns+rest.thanos.peers:19092

2.4. Store Gateway

这个组件是用来为prometheus提供持久存储的,他同样需要暴露一个http地址和grpc地址来允许thanos集群来访问

thanos store \
    --data-dir             /var/thanos/store \
    --objstore.config-file bucket_config.yaml \
    --http-address         0.0.0.0:19191 \
    --grpc-address         0.0.0.0:19090   

2.5. Compactor

这个组件是用来加速历史数据查询的,sidecar和Store Gate都会把一些历史数据写入对象存储当中,但是这些对象存储中的数据都算是历史数据,为了加速对他们的查询,就需要compactor组件了,他会优化对象存储中的数据,来加速查询

thanos compact \
    --data-dir             /var/thanos/compact \
    --objstore.config-file bucket_config.yaml \
    --http-address         0.0.0.0:19191

2.6. ruler

和prometheus的ruler类似,我们后面讲报警再说

2.7. 对象存储

一个正常的s3存储的配置如下

type: S3
config:
  bucket: ""
  endpoint: ""
  region: ""
  access_key: ""
  insecure: false
  signature_version2: false
  secret_key: ""
  put_user_metadata: {}
  http_config:
    idle_conn_timeout: 1m30s
    response_header_timeout: 2m
    insecure_skip_verify: false
  trace:
    enable: false
  part_size: 134217728
  sse_config:
    type: ""
    kms_key_id: ""
    kms_encryption_context: {}
    encryption_key: ""

最少也需要提供这四个选项bucket, endpoint, access_key, 和 secret_key。也就是minIO的四个选项,bucket_config.yaml文件内容如下

type: S3
config:
  bucket: ""
  endpoint: "localhost:9000"
  access_key: "AKIAIOSFODNN7EXAMPLE"
  insecure: false
  signature_version2: false
  secret_key: "wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY"
  • 微信公众号 云原生技术课堂

  • 专题讲座

2020 CKA考试视频 真题讲解 https://www.bilibili.com/video/BV167411K7hp

2020 CKA考试指南 https://www.bilibili.com/video/BV1sa4y1479B/

2020年 5月CKA考试真题 https://mp.weixin.qq.com/s/W9V4cpYeBhodol6AYtbxIA

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,968评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,601评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,220评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,416评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,425评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,144评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,432评论 3 401
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,088评论 0 261
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,586评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,028评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,137评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,783评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,343评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,333评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,559评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,595评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,901评论 2 345