基于开源软件的实时数据库智能监控平台研究

(整期优先)网络出版时间:2020-11-30
/ 2


基于开源软件的实时数据库智能监控平台研究

李辉

云南电网有限责任公司信息中心

摘要:利用开源软件建立实时数据库智能监控平台,能够实现对城域数据网的运行情况和设备状态进行实时监控,并能将报警信息及时发送给指定邮箱,实现对问题的及时发现、及时处理。使用该平台进行网络监控,更能满足网络运营商的需求,且不需要做额外的成本投入,是一种性价比较高的网络监控平台。文章对有线数据库网络监控平台的目标进行介绍,并针对智能网络监控平台的部署,对智能数据网络监控的具体内容进行简单的探讨。

关键词:开源软件;自动报警,智能监控


运营级别的网络监控系统,应当实现能够自动对网络设备的运行状态进行实时监控,出现安全隐患和故障时能够实现自动报警,并且能够将主要网络流量按照日常分布进行统计和储存,在需要的时候自动调用,为网络的建设和扩容工作提供参考依据。

1、开源软件实时数据库智能监控平台的目标

随着互联网在千家万户的普及,人们的工作、生产、生活、娱乐等都离不开互联网的帮助,对网络已经形成了极强的依赖性。在互联网技术不断发展的形势下,互联网用户不断暴涨,作为网络运营商,为广大用户提供的服务水平和服务质量也应当有所提升,但目前网络运营商的数据智能监控系统依然比较落后,无法跟上网络发展的需求,而且每一次对网络进行升级改造建设后,都需要对网络监控系统进行重新的开发和改造,值得注意的是,在这方面的投入是不会带来收益的,因此,网络运营企业往往对其进行忽视。作为新时代的网络维护管理工作人员,需要在尽可能不增加成本开支的基础上,来实现网络监控的目的,因此需要利用开源软件建立起智能网络监控平台。通常用到的是Linux系统作为其基础服务平台,并运用其他相关套件进行科学搭配组合,形成基于一定协议下的网监系统,实现在实际系统运行的过程汇中,对产生出来的数据进行实时采集,并形成动态化的图表,一旦设备达到阈值或出现当机情况,该系统会自动生成报警信息,同时启动邮件发送程序,将故障报告以邮件的形式发送给实现设置好的邮箱,从而达到实时监控和及时报警的目的。而且当今的智能手机都拥有手机邮箱业务,警报信息可以直接发送到相关人员的手机上,这样就能保证出现故障预警信息,能以最快的速度进行定向通知,增加智能监控系统的时效性。

2、对数据库智能监控平台的部署

在硬件需求方面,此平台对硬件的需求并不是很高,只需要有一台较为良好的服务器就足够了;不过平台对于软件方面的需求相对较多,开源软件包含达到内容也很多,例如Linux、Apache、MySQL、PHP等,这些都是可以通过网络进行下载的开源软件内容;对于网络的需求方面,服务器应设置在机房的中心位置,并与整个系统之中的核心设备进行连接,如此一来才能更好避免网络监控平台受其他设备问题的影响。

3、基于开源软件的实时数据库智能监控具体内容

3.1监控各个设备能否正常运行

在这里需要监控的设备有很多,主要包括路由器、交换机、宽带的网关、视频服务器、网络地址转换设备、调制解调器端头设备、以太网无源光网络设备、以及WEB和DNS服务器等。进行智能监控的具体内容包括,中央处理器是否超过运转负荷、设备有无当机情况、设备温度是否在正常范围内、风扇的转速快慢、系统内存利用率、有无端口异常断开或错误等。要想做到对以上问题实时监控,除了安装开源软件Cacti系统之外,还需要安装与之有关的插件,首先对其构架进行扩展和支持,然后在按照合理顺序对各种插件进行安装,再还应打开Cacti页面,利用相应插件给其中不同用户配置不同的使用权限,对设备添加成功之后,在监控页面上的选项卡中就会出现所要监控的设备图标,并且是一种简单明了的形式显示的,每个设备都会有四种不同状态的图标显示,分别代表正常、数据接收、达到阈值、当机,这四种状态还会分别以不同的颜色展示出来,分别是绿、蓝、橙、红。一旦设备发生当机或无法连接,系统就会发出警报,同时该设备图标变为红色,以便工作人员能够及时发现并处理问题。

3.2对主干网络流量的智能监控

对主干网络的流量情况进行监控,能够实现对其流量多少和流量分布情况的统计和掌握,为接下来的网络系统升级和改造提供一定的方向指导和数据参考依据。在对网络主干进行流量监控过程中,通常要实现设置好一个阈值,比如如果主干网络带宽是1G,那么可以设置阈值为整个带宽的80%,也就是在流量达到或多于800M时要自动生成一个报警信息,并向预先设置好的邮箱发送故障报告,如此一来就保证了一旦主干网络中流量达到或超过整体带宽的80%时,网络的管理人员能够及时得到通知,并明确问题所在,从而对其进行及时的检查和处理,防止流量阈值对整体网络运行造成的影响,确保其高效平稳运行。

3.3对线路实现热备用等问题监控和警报

如果系统重要线路的热备用以及城域网无法实现可靠的双机热备,要在不增加运营成本投入的前提下,降低故障发生频率,提升网络整体运行质量,是新时代网络管理人员应尽的职责。想要对各个不同路由器下的线路实现热备用,并且在线路故障时发送故障报告,从而第一时间通知线路维护部门进行抢修,修复完成后能够自动复原,并再次发送恢复运行报告,以上这些功能均可以通过开源软件在以太网中的运用来实现。以太网通道技术能为网络运行提供高速冗余的方式,实现设备之间的畅通连接,并将两个设备之间的多条物理线路集合在一起,在科学捆绑之下形成一条设备间最为通畅的逻辑线路,这样一来就达到了增加带宽的目的。要想构成以太网端口和线路的融合使用,必须保证其模式、端口和速度方面具有相同的特性。当以太网通道中有某一线路中断时,只要系统中还有其余的线路能正常工作,网络流量就会自动转换到其他畅通的线路中去,但是在转移的过程中可能会出现突然中断的现象,但这种中断通常只是暂时的,一般最多只存在几秒钟的时间。通过开发Cacti相关模板可以更好实现这一目的,其具体方法是先在设备中产生出新的图表,并将需要监控的图表指定为所需要的类型,这些图表可以不出现在控制面板中,只要能够产生相应格式的文件即可。然后在当中设置阈值模板,对所需要监控设备的阈值进行设置,在这个过程中将会产生一个新的阈值,在这个阈值上需要设置一个范围,其中一个表示正常,另外一个表示故障,一旦端口超出阈值或当机就会发送故障邮件,并且实现设置好的控制面板中也会出现相应的警报信息,图标此时会变成橙色,方便工作人员更为直观的查看,并将故障及时报告给网络管理人员。

3.4对以太网点对点通讯协议的智能监控

对网络运营商来说,拥有更多的合法公共IP地址肯定是一件好事,它能帮助自身解决很多运行上的实际问题。但社会科技进步发展到今天,合法IP地址已经剩的很少了,运营商想要获得足够的合法地址的可能性微乎其微,因此只能依靠以太网中的网络地址转换设备来实现各种网络用户的接入。这些设备能否正常运行,需要依赖良好而稳定的网络环境,因此可以使用Cacti来对网关NAT设备的运行状态进行监控,监控内容包括中央处理器的内存使用率、地址翻译进程的情况、不同IP所对应的控制数量等。所有网络设备都是支持简单网络管理协议的,并且在这些协议中我们可以得到所需的设备信息等公开内容,通常在网络上的对应模板中,可以实现对这些相关数据的采集;还有一些是厂家私有的,需要到专门的产品库来采集。使用这些手段可以方便对以太网点对点通讯协议网关和网络地址转换设备的监控。

3.5对重点客户和大客户的智能监控

一般情况下,网络运营商对重点客户和一些大客户都是采用光纤收发器与客户端进行有效连接的,要想对其实现智能监控,可以通过利用光纤收发器的故障转移功能来进行,使之与系统中的相应模板充分结合,从而实现对其实时智能监控和故障报警的功能。例如,对客户1的中心接入点使用光纤网络延伸到机房2的交换机端口上,1和2之间就是光纤链路,两端对接的都是光纤收发器。在采用光纤收发器的故障转移功能时,假如1和2之间的出现故障导致连接中断,就会造成机房2这边的光纤收发器以太网端口当机,这样一来接入交换机的端口也会因为失联而出现当机现象,这时智能监控系统就会发挥作用,检测到其存在的当机状态,监控平台会自动发出声光警报,并将故障信息第一时间以邮件形式发送至预设好的邮箱中,以便网络管理人员能够及时发现问题,并与客户取得联系,避免客户方面由于不明原因而盲目查找问题,从而提升用户的满意度。

结语:采用开源软件中的Linux系统,可以构建出实时数据智能监控平台,在平台中运用Cacti相关套件组成基于SNMP协议的网络监控系统,能够实现对网络系统运行信息实时采集,在设备或网络线路出现当机、达到阈值或传输中断时,自动生成报警信息,同时还能将其发送给指定的邮箱,方便网络管理人员及时发现并处理相关故障和问题。