29.7.6 编写故障处理步骤,并通知请求单位进行处理。由请求单位技术人员进行故障处理。必要时可远程登录到请求单位的系统上协助处理系统故障;也可提供现场技术支持。
29.7.7 编写故障处理报告,报告由中心存档。有重要故障监测经验的,由中心组织对全体技术支持人员进行培训。故障检测过程、处理办法、思路、原理、处理步骤等信息进入支持库。
29.7.8 重大系统故障报部主管部门请求故障处理命令,故障处理报告报部主管部门。
29.8 安全故障处理
安全故障一般会使本系统数据的安全性受到外来威胁,在发生安全故障时,应首先从系统中拆除相关安全设备、切断外界连接通道、停止安全系统运行。
安全故障包括感染病毒、口令泄密、安全屏障被攻破、安全设施失效、安全系统漏洞、网络通信受到监听和干扰,这几种情况的安全故障处理步骤如下:
29.8.1 感染病毒的处理步骤如下:
(1)病毒感染一般是因为在系统中安装、运行了非客票系统所需软件所至,所以从管理上应严格要求,杜绝私自安装、运行非客票系统所需软件。在必须安装运行其它软件时,应预先进行病毒检查。
(2)如发现系统中任何一台计算机感染病毒,应立即切断地区客票中心主机与相应车站和病毒感染机与车站服务器的联系,切断TCP/IP匿名服务,并检查地区客票中心下属的其它车站是否发生病毒感染。
(3)如发现地区客票中心下属多个车站感染病毒,应立即切断该地区客票中心与铁道部客票中心的联系,并立即报部主管部门请求进行病毒处理。报告内容应包括病毒代号、发现日期、检查和清除工具。铁道部客票中心应立即切断与所有地区客票中心的网络连接,通令全路各地区客票中心进行病毒检查。
(4)中断所有相关网络通信、切断网络通道(关闭交换机和路由器即可),逐台(任何联网的计算机)检查和清除病毒。
(5)如病毒感染发生在车站窗口机上,应暂停售票业务,并通告旅客。
(6)病毒清除完成后,恢复车站级系统联网运行。
(7)若地区客票中心下属其它车站未感染病毒,恢复地区客票中心级系统联网运行。否则应待所有下属车站病毒检查与清除完成后,才能恢复地区客票中心级系统联网运行。
(8)若全路多个地区客票中心被感染病毒,待全路所有地区客票中心病毒检查和清除完成后,恢复铁道部客票中心与各地区客票中心的连接。
(9)编制病毒检查和处理报告,报部主管部门备案。
29.8.2 口令泄密的处理步骤如下:
(1)更新连接本地服务器上所有用户的口令。
(2)检查系统日志,确认口令泄密的时间、地点。若口令泄密是远程接入点,应立即关闭远程接入点进行检查。
(3)检查用户是否按口令管理规定定期修改口令。应严格管理,要求定期更换口令。
29.8.3 安全屏障被攻破的处理步骤如下:
(1)安全屏障是防止外部非法侵入的重要手段,若发生,应立即切断外部连接通道,关闭被攻破的安全设备。
(2)检查被攻破的原因。若是安全设置不当,应立即修正安全设置,并继续观察安全设备的屏障作用。
(3)向部主管部门报告被攻破的安全屏障设备生产商、设备型号、攻击情况等,请求部检查全路是否有同型号安全设备。
(4)如需要修正安全设置,应立即通知全路修正系统安全设置,并检查是否同时发生口令泄密事件。
(5)如是安全设备的设计缺陷,应立即撤换。不能立即撤换的应关闭相应的外部连接通道,并检查是否发生口令泄密事件。
29.8.4 安全设施失效的处理步骤如下:
(1)撤换失效的安全设备。
(2)如没有替代安全设备可供撤换,关闭与该安全设备相关的外部连接通道。
29.8.5 安全系统漏洞的处理步骤如下:
(1)停止使用有漏洞的安全系统。
(2)关闭该安全系统提供的安全通道和安全功能。
(3)切断客票系统与外部系统的一切物理连接,恢复系统专用通道模式运行,直至安全系统漏洞被修正。
(4)待安全系统漏洞被清除后,可恢复安全系统运行、或引入新的安全系统。
(5)恢复安全系统运行后,恢复对外连接通道。
29.8.6 网络通信受到监听和干扰的处理步骤如下:
(1)切断系统所有设备与受到监听的网络通道的连接。
(2)检查受到监听和干扰的位置。对发生的情况进行分析和诊断。
(3)清除干扰和监听点,恢复系统正常运行。
29.9 应用故障处理
应用故障一般是由于使用不当引起,表现为信息显示不是期望的内容,其它模块不能正常运行、或售票业务不能正常开展。由于本系统中的数据存在同步一致、异步一致、延迟一致和统计一致几种情况,有时因网络故障、系统计算繁忙、规定延迟等正常情况也表现为故障现象。因此应首先判断是否为真正故障。
应用故障的处理步骤如下:
29.9.1 在获得处理应用故障的请求后,应首先问明数据输入过程、表现形式、现象、操作模块、实际操作的数据、相关操作、操作顺序、发生时间、目前状况等信息。
29.9.2 要求用户确认相关部分网络连接状况、日志情况、进程调度情况、用户权限分配等是否正常;应该启动运行的进程是否正常运行;系统资源、存储空间、日志空间等是否有足够的富裕。
29.9.3 必要时,在模拟实验室模拟用户的输入,观察模拟实验室的模拟情况是否与用户所反映的情况一致。若一致,可在模拟实验室检查数据的详细记录形式,找出问题原因和处理办法。
29.9.4 必要时,将用户数据导入模拟实验室,按用户提供的操作方法进行操作,观察模拟现象与实际情况的差别。若一致,可在模拟实验室检查数据的详细记录形式,找出问题的原因和处理办法。
29.9.5 必要时,查阅数据的记录形式,改正错误的数据记录。
29.9.6 若发现是程序编码错误的遗留问题,请求应用维护与优化任务。
29.9.7 根据模拟试验和正确的操作手册,编写问题的处理原因和处理办法,相应数据的正确输入方式。处理方法告知用户,由用户改正应用数据。解决问题的方法、原理、步骤记入值班日志。
29.9.8 经常出现的操作错误应向全路相关使用人员通报,提请操作时注意。在影响不大的情况下,请求系统维护与优化任务,转入应用维护与优化程序。在维护与优化时加强数据合法性、输入步骤的检查和控制。
29.10 数据备份
数据备份工作是本系统必须每日坚持的工作,其重要性和作用体现在系统故障时能够及时恢复系统正常运行。数据备份的执行步骤如下:
29.10.1 编制详细的数据备份策略和操作方法、操作步骤,备份操作步骤应包含输入的命令格式、参数等。备份策略、操作方法、操作步骤存档备查。
29.10.2 根据系统运行情况,规定备份工作执行时机。一般情况下备份工作应在售票业务相对空闲且一天的售票业务完成后的时候进行。
29.10.3 备份操作步骤应张贴在控制台位置,便于备份时操作。
29.10.4 准备好备份介质,确认备份介质完好无损。
29.10.5 按操作步骤进行备份操作。
29.10.6 备份完成后,检查备份工作是否正确结束。
29.10.7 检查备份介质是否用完。用完的介质应取出贴上标签,并注明备份数据的日期、备份内容、要求保存的期限。
29.10.8 记录备份日志。将用完并贴好标签的备份介质存档备用。
29.10.9 修改系统参数、升级系统组件、增配系统软件等工作开始前或完成后,应进行系统备份和数据备份。
29.10.10 保存期满的备份数据介质可以销毁其中的备份数据,介质可重复使用。在销毁数据前应报相关负责人核准。
29.11 系统应急恢复
系统应急恢复一般是由于系统发生故障,排除系统故障后需要进行的工作。系统应急恢复要求系统间断运行的时间尽量短,因此应预先做好系统恢复的准备工作。
|