Python完善APC netbotz 250报告功能实现主动式运维。

news/2024/7/8 0:40:13

       首先介绍一下APC netbotz 250, 这是施耐德推出的一款机架式监控主机,能够对所有IT环境进行经济有效而且灵活的监控,号称APC史上性价比最高的环境监测方案,这可不是我吹的,是APC官网的介绍,可参考下面的官网截图。

我们机房有幸也有一套这样的系统,笔者大致用了一下,确实功能还是强悍,支持各种类型的检测,我们这边的使用范围比较小,一般就是使用温湿度监控,有几个亮点还是不错:

  1. 支持Telnet/SSH登录操作
  2. 短信/邮件报警
  3. SNMP支持
  4. Syslog收集
  5. Web UI图形化操作界面

真是麻雀虽小,五脏俱全。

回到我们的应用上面来,我们机房使用的温度报警,当温度达到阈值后,Netbotz 250能够推送报警,然后IT进行紧急操作。

这是一种常规而且也是大多数管理员的操作方式,但是,这是一种被动的管理方式。

随着IT技术的发展,能不能实现报警前置?就是说通过历史数据曲线,发现他有潜在的触发报警的可能,在这个问题发生之前,把问题处理掉,这样可以从被动式管理向主动式管理的转变。

以我们的这个netbotz 250为例,我挑选了一个时间点的温度曲线:

从这个图上可以看到,温度从16:00开始已经开始逐步上升,在到达26°的阈值之前,我们完全可以检查一下机房设备,这样可以避免触发报警。

那天晚上,通过这个报告,紧急联系值班人员干预,温度立马下降,后分析原因,室外温度过低,低于零下4摄氏度,空调制冷故障,简单操作就可以避免一次报警的发生。这是一个真实的案例。

回到本文的核心上来,这个跟Python有什么关系?

要实现主动检查,就需要netbotz 250定时推送报告,这一点APC需要完善,没有这样的报表功能,当然,如果有zabbix, 通过SNMP就可以解决。没有报告,管理员无法发现潜在的问题,也就无法实现主动式运维。该Python上场了。在这里Python主要作用是登录netbotz 250获取温度,绘制温度曲线,发送报告,看来Python还是挺忙的,大致涉及流程如下图:

核心获取温度代码:

host='10.202.0.*'

port=23

username="apc"

password="********"

command="nbsensor -t"

def gettmp()

    try:

        tn=telnetlib.Telnet(host,port)

        tn.read_until(b'User Name :')

        tn.write((username + "\r\n").encode('ascii'))

        time.sleep(5)

        tn.read_until(b"Password  :")

        tn.write((password + "\r\n").encode('ascii'))

        time.sleep(5)

        tn.write((command + "\r\n").encode('ascii'))

        output=tn.set_debuglevel(1000)

        output=tn.read_very_eager().decode('utf-8')

        print("Execution result:\n", output)

        print("Finished")

        return output

    except Exception as e:

        print("Error occurred: ", str(e))

    finally:

        # 断开与目标主机的连接

        if 'tn' in locals():

            tn.close()

说明,因python操作telnet速度较快,数据还没有进入缓存,任务就执行完成,导致数据获取不全,所以用了time.sleep(5)进行等待,另外用tn.read_very_eager()取代tn.read_all().

剩下的操作就是绘制温度曲线,然后通过邮件的形式将内容发送出去,可参考下面的模板。

       自动化、数字化、主动式运维任重而道远,主动式运维不单单IT运维人员的工具,同样也可以在厂务,维修,制程等部门推广,运维的理念随着技术的发展而不断更新,唯有不断学习,才能避免被时代淘汰。


http://lihuaxi.xjx100.cn/news/2001383.html

相关文章

STM32F407移植OpenHarmony笔记4

上一篇写到make menuconfig报错,继续开整。 make menuconfig需要/device/soc/*下面有对应的Kconfig文件。 直接去gitee下载stm32的配置文件拿来参考用。 先提取Kconfig文件,后面再添加其它文件。https://gitee.com/openharmony/device_soc_st/tree/Open…

利用路由守卫实现token访问拦截

需求:在项目中,我们经常会遇到对路径访问的拦截,如:未登录时,只允许访问登录和404页面,在登录后,不允许直接通过url访问登录页面等。本文章将对该需求做简单介绍。 一、实现思路 添加全局路由守…

点餐APP开发需要用到的一些源代码

在数字化日益普及的今天,点餐APP已经成为人们日常生活的重要组成部分,从校园食堂到高级餐厅,从快餐外卖到定制化营养餐,点餐APP的多样性和便利性满足了不同用户的需求,本文将深入探讨在开发一款点餐APP时可能用到的源代…

系统架构设计师-22年-下午题目

系统架构设计师-22年-下午题目 更多软考知识请访问 https://ruankao.blog.csdn.net/ 试题一必答,二、三、四、五题中任选两题作答 试题一 (25分) 说明 某电子商务公司拟升级其会员与促销管理系统,向用户提供个性化服务,提高用户的粘性。…

JeecgBoot jmreport/loadTableData RCE漏洞复现(CVE-2023-41544)

0x01 产品简介 Jeecg Boot(或者称为 Jeecg-Boot)是一款基于代码生成器的开源企业级快速开发平台,专注于开发后台管理系统、企业信息管理系统(MIS)等应用。它提供了一系列工具和模板,帮助开发者快速构建和部署现代化的 Web 应用程序。 0x02 漏洞概述 Jeecg Boot jmrepo…

搞懂Nginx的.conf文件路径配置

详解server中各部分作用及如何配置 如下图所示,这是我配置好的一个server代码块,我这里配置了https,所以会比默认的多一部分内容,如果你只需要配置http,则只需关注红色方框的部分即可,下面会按顺序讲解。 ①…

达梦数据库的最大连接数,怎么查看和设置

达梦数据库是国内领先的数据库产品开发服务商,国内数据库基础软件产业发展的关键推动者。公司为客户提供各类数据库软件及集群软件、云计算与大数据等一系列数据库产品及相关技术服务,致力于成为国际顶尖的全栈数据产品及解决方案提供商。 此公司服务于包…

【QT+QGIS跨平台编译】之十七:【iconv+Qt跨平台编译】(一套代码、一套框架,跨平台编译)

文章目录 一、iconv介绍二、文件下载三、文件分析四、pro文件五、编译实践一、iconv介绍 iconv是一个用于字符编码转换的开源程序。它可以将一个字符集的文本转换为另一个字符集,例如将UTF-8编码的文本转换为GBK编码。 iconv的主要特点包括: 支持多种字符集:iconv支持多种…