信息与电脑China Computer&Communication2016年第1期
浅谈民航管制综合信息系统的运维管理
张遒哲
(民航中南空管局通信网络中心,广东 广州 510403)
摘 要:随着航班量的不断增加,管制综合信息系统(以下简称管综系统)在空管开发人员的努力下如雨后春笋般应用到飞行指挥的各个部门,发挥着越来越重要的作用。但我们也要看到这种快速增长背后隐含的风险,那就是对于后台服务器、网络的日常运维、应急处置提出了越来越高的要求。而当前空管运维人员面临的现状是:各系统监控方式、软硬件监控手段不同,厂家针对运维需求的更新迟缓。基于此,提出对于管制综合信息系统一体化运维的概念,通过深化培训、优化监控、总结不足、全面提升管制综合信息系统的运维现状,为民航飞行安全保驾护航。相信也能够给其他信息系统运维单位提供一定的借鉴。
关键词:Solarwinds;民航管制;综合信息系统;一体化运维
中图分类号:TP311.52 文献标识码:A 文章编号:1003-9767(2016)01-190-02
随着民航事业的飞速发展,民航空管系统通过引进新技术,改进管制流程,不断地提高空管保障能力,以满足日益增长的航班量需求。例如航班信息处理系统(FIPS,Flight Information Process System),塔台运行管理系统(TOMS,Tower Operation Management System)、中南地区航班协同放行系统(包括多机场统一放行子系统、机场放行排序子系统、协同决策平台子系统、飞行计划统一管理子系统、塔台电子进程单子系统)、航班信息发布系统、雷达引接系统、电子值班系统等。这些系统的上线使用,极大的方便了管制员的工作,减轻了一线管制的工作压力。但随着信息系统的快速增多,问题也随之而来:系统间运维方式差异较大;系统版本还不够稳定;各系统的日常监控及应急处置手段不够齐全;运维人员的培训没有跟上业务增长的步伐……怎样做好这些系统的日常运维,怎样才能及时发现信息系统存在的问题,及时解决发生的故障就成为了一线运维部门的急需解决的难题。全国各地空管分局也在面临同样的问题,大家都在摸索中不断总结,不断前进。
中南空管局通信网络中心在2013年的时候就前瞻性地提出了“全面加强管制综合信息系统运维”。经过近3年来的努力,通过“一体化运维”概念的提出及实施,改变了以往粗放型的运维管理(遇到问题找厂家),呈现出较好的态势,满足了现场安全保障的需求。下面就将具体经验进行分享。
维部门针对各系统的重要作业开发了专门的监控网页,设置告警分类及告警音,较好的解决了故障难发现问题。
随着管综各套系统的研发,监控网页也就越来越多,根据现场运维人员的需求,又将监控网页进行了整合,分成两级监控,第一级是面向系统,第二级是面向程序、作业。至此,软件监控功能基本成型。1.2 硬件方面
硬件监控也是必不可少的一个环节。空管服务器设备虽然属于商用级别,但硬件故障还是偶有发生,特别是服务器均为24小时在线运行、数据量日益增多都给服务器运行带来较大的压力。
我们主要依靠第三方监控软件实现了对所有管综的硬件监控,并达到了较好的经济效益。在这里,重点介绍两款经典监控软件:Whatsup与Solarwinds。其中Whatsup主要实现网络Ping功能的监控,人机交互界面较好。Solarwinds主要实现对CPU、内存、磁盘剩余空间等硬件方面的监控,此项功能极大简化了值班人员的巡视检查负担,且因为预警阀值的设置,往往能够提前介入,消除了运行过程中潜在的风险。仅2015年,通过硬件监控就成功处置了如虚拟机磁盘空间满;内存告警;固件版本老化;电池告警等10余起安全隐患。1.3 人工辅助方面
设备监控性能再完善,最终解决问题的还得是依靠人。因此,值班人员的日常巡视也是必不可少的一个环节。技术人员要针对监控的死角、监控的重点等内容制定不同频次的人工巡视进行辅助。我们依靠巡视检查,能够解决及时发现问题,但如何能够实现及时解决问题呢?一是内部解决,另一个是外部解决。内部解决主要依靠现场运维人员的日常培训及故障经验总结,外部解决是委托给技术支持进行处置。
1 管综系统的日常监控运维
管制综合信息系统由于种类较多,信息交互复杂,各系统开发背景、用户使用环境不同,造成了运维界面复杂,因此,我们引入了一体化运维的概念,即运维讲究软件监控与硬件监控相结合,自动监控与人工辅助相结合。1.1 软件方面
化繁为简,将管综系统看作是一套系统,各个子系统是被分解成的一个个独立模块,而模块又能分解成一个一个的“作业”“程序”。架构清晰了,只要能确保这些重要的点运行正常,管综系统的正常运行就有了基础保障。为此,运
2 管综系统的故障经验积累
2.1 管综系统相关培训开展
首先,不能孤立地看待管综系统,对于运维人员来讲,
(下转第192页)
作者简介:张遒哲(1982-),男,山东郓城人,本科,主任工程师。研究方向:民航通信网络规划管理。
— 190 —
信息安全与管理
信息与电脑China Computer&Communication2016年第1期
提示需要做病毒查杀工作。
2.3 计算机杀毒软件的安装与应用
计算机病毒对计算机系统的危害性很大,企业计算机要安装专业的杀毒软件,查毒软件在安装后能够对计算机进行自动定时查毒处理,这种查毒对于潜藏在计算机内部的病毒有很大的杀伤力度,能够起到预防计算机病毒复制的作用。用户在使用杀毒软件的过程中要注意杀毒软件的实时更新工作,以便查毒过程中不会遗漏新型病毒,确保计算机系统的安全运行。2.4 加强用户账号安全
随机计算机网络信息技术的发展,越来越多的网络软件设计用户账号,而用户账号涉及面比较广,它包含电子账号、系统登录名以及网上银行账号等。在网络信息系统中获得合法的系统登录名和破解密码是网络系统中最主要的方法。所以在网络系统中为了减少网络安全问题,提高账户安全,首先用户可以尽可能的将系统用户登录账号设置的复杂一些,其次尽量不要在同一个网络中设置相同或相似的账号,账号的设置一般要有字母和数字混合应用,而且账号密码的设置尽可能长,并定期更换密码,以便最大程度的保障网络系统的安全。2.5 数据加密技术的应用
在计算机网络系统中数据加密技术是最主要的安全防护技术形式之一,这种技术主要是通过网络传输的信息进行数据加密,从而有效保障系统的安全性。加密技术是对网络上传输数据的访问权加强限制的一种技术类型。在数据加密中原始数(上接第190页)
所有的跟管制相关的信息系统都可以一体化的看待。这些系统不是孤立的,都可以看作管综系统的一个部分或者一个模块,有助于运维人员的理解及故障处理。
其次,培训不是一蹴而就的,是一个不断深入的过程。根据用户需求订制的培训才是高效、有效的培训。目前,中南各地往往由厂家在建设完毕后开展了扫盲培训班后就鲜有后续培训了,这主要是管理人员的责任。很多运维人员对于用户程序界面、操作流程都不清楚,又如何谈管综系统的运维?
再次,培训应采用多种模式,只要能够提升运维人员的水平提升就应主动申请。例如:邀请管制人员进行程序应用培训;邀请开发人员进行后台流程培训;运维人员总结故障处理情况,邀请开发人员共同探讨;安排人员自学厂家硬件设施、虚拟化技术等,然后进行扫盲培训。
最后,培训只是手段,培训的结果要以应用为目的,这需要管理人员进行严格的实操考核,并进行实践检验。2.2 管综系统运维经验总结
一套还不够成熟的管综系统,它的故障具有多样性、突发性,有效的经验总结非常困难。比如,一起因程序bug原因导致的程序失效问题,开发人员第一时间就针对bug进行了程序修订,运维人员无法进行任何处置,只能报故障给开发人员进行检测。长此以往,运维人员就容易形成惰性心理和依赖心理。等遇到运维人员可以处置的故障,他也是习惯性的去拨打技术支持电话。因此,需要建立一套合理的运维经验总结流程,推动管综运维水平的提升。目前,中南空管局实施了工作平台,以绩效激励模式,鼓励运维人员自动上
据和密钥加密所产生的经过编码的数据一般被称为密文。加密的反向处理是解码,这个过程主要是将密文还原为原始明文,再此过程中解密者必须利用相应的加密设备对密文实施解密处理。这样就能够加大解密的难度,加强网络信息安全。
3 结 语
计算机网络技术在不断发展,其安全防护措施也必须不断完善和发展,促进网络系统安全防护措施的提高。同时由于网络安全是一个不断变化、更新的系统,所以其安全防护措施也不能仅仅依靠一种和几种防护措施。采用多种安全防护措施相结合建立系统的网络信息防护策略和安全防护体系,为计算机用户提供一个安全、稳定的网络环境。
参考文献
[1]彭珺,高珺.计算机网络信息安全及防护策略研究[J].计算机与数字工程,2011,39(1):176-178.
[2]冯秋霜,孙雨兰.浅析计算机网络安全与防范技术[J].黑龙江冶金,2009(1):51-52.
[3]]刘秀彬.浅谈计算机网络信息安全管理[J].价值工程,2010,12(14):148-149.
[4]彭小青.浅析计算机网络的安全技术[J].硅谷,2012(11):145-146.
报故障处理经验,技术人员进行后续跟进、更新;管理人员不定期召集人员,对故障经验进行再回顾、培训,温故而知新。2.3 建立定期交流制度
管综系统研发部门的任务量多、工作量大、工期时间短等原因,往往会导致新上线的系统版本不稳定,而运维部门的工作职责又要求不能以牺牲安全为代价去换取新系统上线;开发人员面对的只是程序、代码,没有现场故障处理的那种压抑、紧迫感。有鉴于上述问题的存在,有必要让开发人员、运维人员定期进行思想上的碰撞,产生火花,解决问题。可以建立定期交流机制,由运维单位根据实际情况按月或按季度将运维中存在的问题提交给研发部门,研发部门安排专人进行解释、回访。2.4 职能部门督促问题解决
工作流程在建立前,我们要把相关单位、人员想象成无赖,他们总是会钻制度的空子,去偷奸耍滑。这样,在流程、规章就会最大可能的被完善。管综系统的交流工作开展也是如此,需要上级安全职能部门的参与、介入。因为运维、开发单位都有各自的工作压力与工作重点,当问题不可调和时,就需要第三方机构进行仲裁,问题的最终解决与否也需要其进行督促、指导。
3 结 语
随着民航事业的发展,空管系统的应用系统会越来越多,工作环境是不断在变化的,我们的运维也要与时俱进。一线运维要想改变目前的疲于应付、问题频繁的状态就要有决心、有勇气、有办法来创新管理,实现软硬件环境的统一监控、减轻一线运维人员的工作压力,从而在本质上构筑管综系统的运行安全。
— 192 —
因篇幅问题不能全部显示,请点此查看更多更全内容