zabbix triggers
zabbix的触发器,通俗意义上讲是一个布尔型的条件表达式。我们通过定义区间的数值和item采集到的数值做对比,如果采集的数值在我们定义的区间内,就会触发event(事件),action捕捉到event,通过信道向运维人员发送报警信息
trigger定义
host:item.function().opercation.(iregex).contentist
host:item 为监控主机的采集项
function 采集采用什么函数进行取值。比如最近三分钟的平均值,最近10次的平均值,最后一次的数值...
opercation 采集到的数值用什么方式进行比较例 + - = * / > <....
contentist 目标值
trigger 报警级别
- Not classified 无定义灰色
- information 信息绿色
- warning 警告黄色
- Average 严重橙色
- High 很严重红色
- Disaster 非常严重,比如资产受到了损失亮红色
trigger 测试
测试item中网卡流入的报文数大小,如果再每秒多于500个则报警
- Name: 此triggers的名字
- Operational data: 操作的数据
- Severity: 此Trigger的报警级别
- Expression: 触发报警的条件
- Expression constructor: 如果有多个表达式,则在这定义其关系,与或者或
- OK event generation: 此报警恢复的表达式,Expression表示采用上面的表达式,Recovery Expression恢复报警的表达式,重新定义一个。None,无恢复操作
- PROBLEM event generation mode: 事件触发的方式,是串行或者并行
- OK event closes: 事件被关闭的匹配,ALL problems(发生此事件的所有机器),ALL problems if tag values match(发生此事件,用tag匹配到的机器)
- Allow manual close:
- URL: 用此url访问,则能够显示底下Description信息
-
Description: 简单此触发器发生的故障信息和恢复手段,可用上面的url访问到
可在采集数据项中,看到给相关采集点配置的trigger
模拟测试trigger
server端
yum -y install hping3
hping3 --faster 10.0.0.101 //10.0.0.101为zabbix-agent主机
可以看到此时网卡的流量剧增
可以看到已经触发trigger
模拟邮件报警
添加报警媒介
- Name: 添加报警媒介的名字
- Type: 使用的类型
- SMTP server: 邮件服务器的ip
- SMTP server port: 邮件服务器的端口
- SMTP helo: 向哪个邮件服务器发送helo的信息,相当于tcp协议里面的三次握手
- SMTP email: 发送者的信息
- connection security: 连接的方式
- Autentication: 使用什么方式进行邮件服务器认证,由于我们是本地linux自带的所以不需要认证
- Message format: 信息的格式是html和text
- Description:此媒介的描述
添加action
- Name: 此action的名字
-
Conditions: 添加此aciton匹配的trigger
- Default operation step duration: 默认执行operations的间隔时间
Operations
- Operation type:选择执行的操作,是发生信息还是执行远程命令
-
Steps: 实现报警升级,如果第一步出现报警,隔多长时间触发第二个步骤
+Step duration: 每个步骤的间隔时间,及如果定义2个小时,则首先给运维工程师发生,如果没有解决就给运维主管发送,然后依次每隔2个小时升级 -
Send to user groups:发送给相关的组
+Send to user: 发送给具体某一个人 - Send only to: 使用什么媒介去发送
- custom message: 自定义邮件内容
Recovery operations
恢复操作
一般定义成Notify all involved发送给所有人
Update operations
更新操作
添加接收报警人的信息
在zabbix用户中定义,报警人的接收媒介
- Type: 选择媒介的类型
- Send to: 发送给谁
- When active:什么时候发