《ZABBIX全栈级监控实践》系列将由浅入深探讨如何实现ZABBIX全栈级别的监控。
本文是《ZABBIX全栈级监控实践》的第二篇:主要讨论基于Windows操作系统的监控实现方式。
一、概述
Zabbix是一款基于Linux操作系统的开源监控平台。同时,它对于Windows操作系统的监控也很出色。之所以把Windows和Linux监控加以区分,主要是由于两者在实现方式上的区别。
Zabbix原生提供了一些函数以满足基本的配置管理和监控需求,如system.uname, system.uptimne, agent.ping等。另外还有一些比较通用的Simple Check,如ICMP PING,TELNET等。
对于Windows操作系统而言,如果需要获取更进一步的配置信息及性能数据,需要使用Zabbix原生提供了wmi.get和perf_counter这两个函数以实现基于Agent的操作系统监控。这两个函数分别对应了Windows平台两个重要功能:WMI(Windows管理规范)和Performance Counter(性能计数器)。
通过这两个途径,可以基本满足Windows平台80%的监控需求。
二、Zabbix via WMI
微软提供了一套成熟的Windows管理规范(Windows Management Instrumentation,简称WMI)。WMI是一项核心的 Windows 管理技术;用户可以使用 WMI 管理本地和远程计算机。关于WMI的信息,可以参考微软的KB。
简单的说,WMI中包含了当前Windows操作系统的大多数的配置信息,如磁盘、网卡、BIOS信息等。
通过微软提供的WMITOOLS工具,可以通过图形化界面查看各WMI类的方法和实例,下图左侧显示了一些WMI的类,右侧显示了Win32_FAN这个类的一个实例。
Zabbix可以通过wmi.get的函数,获取这些信息。再次强调,通过WMI获取的主要是配置信息。
以下是作者整理出的一些常用的Windows系统配置信息:
不难发现,wmi.get的函数主体,是类似SQL的查询语句。因此对于不严格的查询,可能会返回多行结果。在这里需要注意,wmi.get函数说明中有提到:wmi.get的函数是Execute WMI query and return the first selected object。因此,只返回第一个值。类似于读取指定网卡的配置信息的需求,只能对select查询进行AND过滤,但一定程度上会影响查询效率。需要具体评估或采取用户自定义参数的方式提高效率。
二、Zabbix via 性能计数器
性能计数器,也叫做性能监视器,是微软提供的查看系统性能的工具。
在Windows系统中的运行处,输入perfmon.msc即可调用性能监控器。我们通过添加具体的计数器(Counter)来实现对具体性能指标的监控。
Zabbix的一大优势是可以直接支持这种调用性能计数器的监控方式。
Zabbix中,perf_counter函数提供了直接读取性能计数器的方法。
如:监控逻辑卷C盘的Avg. Disk sec/Read指标:
perf_counter[\236(C:)\208]
大家可能会问到,后面的数字是怎么来的?
可以通过Windows下的一个名为showperf.exe的工具,进行查询。该工具包含在微软官方提供的Windows Resource Kit中。
根据这个文件名,不难发现,它就是用于显示计数器信息的工具。界面简洁明了。
按上述提到的,我们可以看到\236(C:)\208 所对应的计数器名称为Avg. Disk sec/Read。通过该工具,可以快速找到对应的性能计数器。
三、哪种方式更适合?
Zabbix提供了包括内建函数、WMI、性能计数器、用户参数(User Parameter)等方式对Windows操作系统进行监控。对同一个监控指标(如CPU使用率),可能会存在多种监控方式都可行的情况(如使用内建函数system.cpu.util;性能计数器;用户参数均可以实现监控CPU使用率的需求)。建议优先使用内建函数。对于内建函数无法实现的性能监控,建议使用性能计数器。这两种实现方式的效率较高。
对于WMI和用户参数,建议先行测试后评估。由于Zabbix Timeout最长为60s,在实际使用中,发现部分WMI类的SELECT会超过60s,从而导致超时无法获取数据,这是由于WMI本身的限制导致的。在这种情况下,建议使用用户参数去实现。而对于一些简单的配置信息(如本文中提到的),可以使用WMI实现。
四、附录
以下是本文中提到的一些资源链接:
1、WMI参考
2、性能计数器参考
3、Zabbix官方参考