浅谈IT系统运维检查的工作内容

浅谈IT系统运维检查的工作内容

浅谈IT系统运维检查的工作内容

在前面的文章中,我们了解了IT系统运维检查的概念以及运维在全程软件质量保障中的重要作用,本文我们重点谈谈IT系统运维检查的工作内容。温州市众成企业有限公司根据多年经验将部分工作内容总结如下:

一、信息资产统计工作

基本工作,包含在运行维护服务中,帮助我们对用户现有的信息资产情况进行了解,更好的提供系统的运行维护服务。

内容包括:

硬件设备型号、数量、版本等信息统计记录;

软件产品型号、版本和补丁等信息统计记录;

网络结构、网络路由、网络IP地址统计记录;

综合布线系统结构图的绘制;

其它附属设备的统计记录。

二、网络、安全系统运维工作

从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。

三、用户现场技术人员值守

保证网络的实时连通和可用,保障接入交换机、汇聚交换机和核心交换机的正常运转。现场值守的技术人员每天记录网络交换机的端口是否可以正常使用,网络的转发和路由是否正常进行,交换机的性能检测,进行整体网络性能评估,针对网络的利用率进行优化并提出网络扩容和优化的建议。

现场值守人员还进行安全设备的日常运行状态的监控,对各种安全设备的日志检查,对重点事件进行记录,对安全事件的产生原因进行判断和解决,及时发现问题,防患于未然。

同时能够对设备的运行数据进行记录,形成报表进行统计分析,便于进行网络系统的分析和故障的提前预知。具体记录的数据包括:配置数据、性能数据、故障数据。

四、现场巡检工作

现场巡检工作是进行全面检查的项目,通过该工作内容可使客户获得设备运行的第一手资料,最大可能地发现存在的隐患,保障设备稳定运行。同时,将有针对性地提出预警及解决建议,使客户能够提早预防,最大限度降低运营风险。

巡检包括的内容如下:

编号

巡检内容

1

硬件运行状态检查项目

单板状态检查

电源模块状态检查

风扇状态检查

整机指示灯状态检查

机框防尘网检查

机房温度、湿度检查

设备地线检查

2

软件运行情况检查项目

设备运行情况检查

网络报文分析

设备对接运行状况检查

路由运行情况检查

3

网络整体运行情况调查

网络运行问题调查

网络变更情况调查

网络历史故障调查

五、网络运行分析与管理服务

网络运行分析与管理工作是通过对网络运行状况、网络问题进行周期性检查、分析后,提出指导性建议的一种综合性高级服务。

六、主机、存储系统运维服务

主机、存储系统的运维服务包括:主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。

主机存储系统基本服务内容:现场备件安装,补丁服务,升级服务,现场故障诊断,问题管理系统,系统优化。

七、运维监控管理:CPU 性能管理;内存使用情况管理;硬盘利用情况管理;系统进程管理;主机性能管理;实时监控主机电源、风扇的使用情况及主机机箱内部温度;监控主机硬盘运行状态;监控主机网卡、阵列卡等硬件状态;监控主机HA运行状况;主机系统文件系统管理;监控存储交换机设备状态、端口状态、传输速度;监控备份服务进程、备份情况(起止时间、是否成功、出错告警);监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;对存储的性能(如高速缓存、光纤通道等)进行监控。

八、数据库系统运维服务

数据库运行维护工作是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。同时,密切注意数据库系统的变化,主动地预防可能发生的问题。

此外,运行维护工作还包括快速发现、诊断和解决性能问题,在出现问题时,及时找出性能瓶颈,解决数据库性能问题,维护高效的应用系统。


附件:
运维检查整改登记表.doc

机房巡检表(修改版).doc

金超超(Word2013)

金超超(Word2013)

Hello, my name is Kim, from Shuren University. I can speak English, Chinese of course, and Japanese. 私は 超超 と申します、26歳の会社員 です。よろしくお願いします。

您可能还喜欢...

发表评论

电子邮件地址不会被公开。