SUM服务器监控软件--共享平台解决方案

随着信息化的发展,政府单位、大中型企事业单位的网络系统日益复杂,由于计算机使用者水平不一、不同级别使用者权限不同、日常维护靠某个工程师等因素,信息化管理过程中出现的问题越来越突出。这就要求有一个共享平台,将政府、企事业单位上下级所有设备及业务系统进行统一管理,哲涛科技SUM服务器监控软件从共享平台的角度为客户提供更深入的共享服务。

 

方案总体设计

建立一套成熟、高效的共享管理平台是一个系统工程,需要逐步提高,这不仅仅是对技术的不断完善,也是对管理流程和人员技能的不断完善。

实现信息共享系统管理的第一步是构建IT系统管理基础设施,即建立完整的监控体系、报警通知体系、扩展监控体系。通过集中监控系统的监控功能、报警功能、扩展功能能够让系统运维人员在单一的界面中快速而直接的了解分布在各处同时又纷繁复杂IT各对象的状况,特别重要的是通过监控系统可以对最关键的指标可以设定阀值报警,对达到阀值的指标第一时间通知第一线的运维人员,以让政务平台和共享平台的稳定、可靠运行提供强大的故障发现与集中监控能力。
共享平台设计原则

系统化原则

监控平台的建设着眼于从总体上规划,以平台的整体目标为项目建设的总目标,即规范管理制度,强化管理工作、提供管理决策支持。从平台的观点来看待整个平台的建设,要求各子系统有相互独立性,又要有机地集成在一起,要求平台有一定的自适应能力。平台设计应有层次性和有序性,要坚持从整体考虑,功能结构化层次化,功能目的明确,针对需求,设计上最优化,降低平台的复杂度。

稳定性原则

平台建设应坚持平台稳定性的原则,平台应能保证 7*24 小时稳定运行,平台应采用热备方案。系统的出错应告知可能出现的故障原因,建议系统管理员采取的措施。当系统出现一般故障,甚至是某个子系统完全不能运行时,不能影响整个平台的运行。平台本身的故障必须有细致全面的监控,当出现问题时迅速通知维护人员 ,平台本身的运行及出现故障不能影响其他业务系统的运行,对 IT资源的监测应保证对 IT系统影响最小。

直观方便性原则

平台应采用基于 B/S 界面,应采用直观的展现形式,明确系统所有的功能,方便用户进行操作。例如对网络、业务系统的监控必须提供全面的拓扑图,拓扑图应能标注设备的位置或直接展现设备的位置,当设备出现问题时首先根据问题的等级以不同的颜色对设备的图标进行展现,可以通过对设备图标的操作查看设备所报问题的根源原因、关联问题,建议采取的措施,应能直接对设备图标进行简单的操作。

可扩展、易集成原则

平台的机构、用户、权限管理应遵循标准化设计,应支持部门、用户权限的灵活分配,系统本身应提供单点登录的功能,接口应遵循标准,系统具备高度集成性,可以和多种第三方产品进行集成,进行功能扩展。应能与其他监控系统集成,各子系统接口应具有一定的灵活性。

自动化原则

平台应着眼于减轻运维人员的工作,平台告警信息能够以多种方式通知 IT系统维护人员,告警需支持升级与转发;当发现问题后应主动根据预先设定的模型定位根源故障,搜索知识库,寻找问题的可能解决途径,可能方便地查找相关的技术资料,方便地实现技术资料的共享。

智能化原则

平台应具备一定的智能,能够根据各种现象确定是不是应用系统已发生故障,确定对应用系统可能的危害程度,将重要的信息即时发送项目组领导,以便领导协助解决。平台不仅能发现监控到的硬件故障,也能对软件故障进行分析,根据设定的模型给出问题的原因,建议的解决方案。

为保障共享平台政务版的稳定安全运行,从网络、数据库、服务器、服务器软件、业务软件等多方面对共享平台系统进行监控与保障,具体内容有:

共享平台网络环境监控

网络环境是共享平台系统正常运行的基础,网络出现异常即使系统正常,对于用户的使用体验来说,视出现异常。因此监控网络环境是保障系统的正常运行最基本的监控。

共享平台服务器监控

共享平台的服务器系统的CPU、内存、磁盘、进程、网终流量等进行监控至关重要的,特别是磁盘空间的监控直接关系到系统在高速发展的信息系统中稳定性、数据可增长性方面的重要保障。

共享平台监控预警。

监控的目的是为当发现系统异常时,能够及时有效地将信息通知给运维人员。例如,成果数据质量检查子系统出现异常,通过阀值等方式对核心指标进行报警并即时通知相关的运维人员。

共享平台系统监控展示与分析统计。

监控的指标按照简单、专业、直观的方式展示给运维人员面前。通过分析统计功能发现系统隐患。例如,当共享平台某个查询服务无法正确查询或返回异常持续3分钟后通知相应的运维人员处理或在CDSM等可视化图形界面中以颜色方式进行提醒。

上海哲涛网络科技有限公司版权所有 © 2005-2023       沪ICP备06058430号-1

沪公网安备 31011302000898号

点我咨询