运维监控软件,一个IT人员向往的软件。有了它,眼睛一喵就知道服务器的压力,网络设备的问题;有了它,手机和邮件会随时收到预警报告,可以及时处理问题;有了它,领导视察看大屏幕,倍有面子。这就是为什么要用运维软件。
对于基层IT人员来说,每天忙里忙外,苦逼的要命,还得手工敲命令查看设备状态实在是运维的悲哀。我所在的客户是农商银行,大都数运维人员身兼多职。“上得天堂,下得地狱”,这是对他们最好的描述。
前几年,设备不是特别多,运维也相对简单。随着灾备机房日趋完善,容灾的上线,自主开发等业务越来越多,设备也在不断的增加,设备状态即时获取也成为头疼的问题。
在网络上有很多开源的运维监控软件,如Zabbix和Nagios。Zabbix是一个开源的性能监控解决方案。可以监控服务器、WEB应用程序、数据库、网络设备等的性能。Nagios是一个功能强大的开源服务器/网络监控解决方案,为服务器、交换机、应用程序和服务提供完整的监控和报警机制。它有一个插件API,所以你可以扩展它的开箱即用的功能。
这些软件功能很强大,支持API的二次开发,而且免费。但最大问题是部署麻烦,对Linux系统需要一定的了解,没有售后服务。对于时间贵如金钱的银行IT人员来说,真的无暇顾及。
商用的运维监控软件是一种很好的选择。目前用的比较广泛的产品有广通Broadview R2运维监控软件、摩卡的酷点、OneAPM Si、Perfview、云新的CloudSino,银基监控盒等。有些是软件产品,有些是一体机,不管是功能还是服务都各有千秋,在采购时擦亮眼睛,做到采购前是测试是最好的。
预留二次开放接口也很重要。银行越来越重视开发人才,预留的接口可以为以后新产品接入或功能的个性化扩展打下基础。部分运维软件还能监控到设备风扇的转速、电源的功耗,分析用电功耗等,这也是难得可贵的。可以根据设备的采购时间,过保之前通知运维人员,同时有一键巡检功能,这些都是产品的新亮点。很多产品还集成设备资产管理软件,也能起上很大的作用。
最近一两年,网上开发运维软件(DevOps)Ansible 、Chef、Puppet等特别热门,部分客户会把这个和运维监控软件混淆在一起。运维监控软件是以监控为目的。而开发运维软件除了具备一样监控外,还是强大的运维功能,如批量修改IP,批量修改密码,批量执行脚步等。且留有强大的开发功能,不同软件支持的开发语言不一样。开发能力强的人员,完全可以做成商业产品出售。