加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

电信铁路电力的安全运营

(2011-08-13 22:12:50)
标签:

电信

it

铁路

运营

安全

事故

723

723出来铁路事故,事情牵动各方关注,我不是铁路专家,但是从电信的角度来谈谈运营安全问题。

 

电信原来属于邮电部,部里分电信与邮政两大块,电信最重要,电信安全作为一个行业人员是必须了解的,“责任重于泰山”,“全程全网”,“保证重要通信”,“4201重点工程",都是与安全相关的。

 

大学在南邮,毕业时候,有同学去了上海的4201中同轴电缆载波实习,电路调度错误,导致1800路电话全阻,被通报批评,我大学毕业了,分配在4201的800中同轴电缆载波站工作,分担安徽境内大约200公里的电缆与载波设备维护工作,我们的机房设在地下,是70年代战备工程,可以防止飞机轰炸,每次进入机房都要提着气,一点也不敢怠慢,因为这条线路承担当时是最关键的通信任务,从北京一直到上海,杭州,然后通过海底电缆与日本相互沟通,算是我们国家当时最重要的一条南北通信干线,我们维护这条线路的无人站,线路,还有载波设备,由于线路常常遭受雷击,我还去郑州邮电部科研所,学习防雷,知道需要做好电缆的接地工作,并且测试接地电阻就可以了。无人站也需要做好防雷,安装好的避雷针,做好接地,我们的电缆都是铠装电缆,外面是金属皮,做接地很容易的。

 

而作为机房人员,需要思路清楚,做好调度,4201线路是4根中同轴电缆,其中一根出现问题,还是可以调度处理的,在载波站,可以调度电路,保证相关的话路通信,那个时代,我们的国家还很穷,这条电缆算是花了不少钱用人民币从北京一点点铺到上海的,所以非常重视,西昌发射卫星,所有的观测数据也是在这条电缆传输的,我们都放弃休假随时待命,到了夏季,电缆要防汛,有水害还有雷击,所以要随时做好准备,一旦电缆被击穿,要及时发现问题,与巡房人员沟通,立刻带领车辆前去抢修,而抢修的快慢,直接影响我们整个企业的打分,3分钟以上的全阻算重大事故,需要通报批评。

 

邮电算半军事化单位,每个邮电员工都有一种行业的使命感与责任感。电话断了,影响极大,甚至会影响到外交的。

 

我后来转行专门做程控交换机,我们的交换机中有一台是非常重要的,那就是北京的一台重点交换机,有一次,我的法国同事阿兰修改一个文件导致交换机瘫机了,一般来说30分钟就可以重新启动,但是不知道他改了什么地方,机器就是启动不起来,我们都很着急,邮电部的领导也来了,望着机器干着急,最后等了24小时,机器才起来,阿兰为了这个事情,受到了公司的处分。FORMO这个指令后来被我屏蔽了,不让再用。

 

这台机器在北京大约有4万用户,还是汇接局,所以影响面很大,我至今还记得机器启动不了时候,大家着急的眼神。

 

自此之后,我们每一次进入机房都是提着气,高度警惕,生怕敲错一个字母,对于交换机的操作,总要检查再检查,反复再反复,才敢做动作,一旦发生错误,后果是难以想象的。每一次更换交换机软件,或者增加新的设备,我都要亲自做割接方案,在正规的交换机上面执行之前,先在模型机上面反复演练几遍,类似八路军执行逮捕汉奸的任务,总要先演练几遍,熟悉地形与情况,最后才去交换机执行,而且都是在夜间与周末执行升级操作,这样即使是有问题,也没有关系。

 

我始终记得自己在北京电报大楼迎接黎明的时刻,这个时候往往是5:00钟,而往往是升级到了最后时刻,并且发现了部分用户打不通电话,我需要决定是用新版本还是退回去,还好我总能逢凶化吉,在最后的时候找我问题,5:40,问题找到了,我决定不退回去,继续用新的软件,但是交换机很复杂,新的软件启用之后,肯定第2天有人用电话会发现很多问题,我需要继续在机房里面留守,如果一旦有问题,立刻解决,有的是软件问题,我还需要半夜让法国实验室的人24小时待命,一旦有问题,马上电话修改,这样的电话费很贵的,1分钟是20元,而一个月下来常常是几万块的电话费,因为一个问题要想说清楚需要不间断地与实验室沟通,但是这个时候是不能够考虑成本的,事情要做就要做好。

 

关于平时的维护,我制定了维护守则,每天都要备份,每个月要做计费,还有大的系统备份,一旦有任何告警与故障,要及时上报,将其消灭在萌芽状态。

 

交换机本身就是一个电脑,有2块镜像的硬盘,只有300M大小,不过还好,因为是内部系统,所以还没用病毒,升级是常常的事情,我们的机器一年大约至少要升级2-3次,所以夜间加班也是平常的事情。这个时候也要准备好,到了夜里3点就饿了,吃一点买来的面包饮料,填充一下肚皮,这就是电信的人生,从工作来看,电信人生其实就是担惊受怕的人生,很多人都得了胃溃疡,我想大约与这个工作的高度责任感有关。

 

要提高电信的接通率,需要做大量具体的工作,其中一项就是要花时间做各种测试,找到问题的原因,交换机不通有信令的原因,有7号信令白皮书蓝皮书规范的原因,还有中国规范与外国规范的原因,这些都需要做具体的测试,我有一个北邮毕业的同事,他对于问题的研究与看法比较表面,他说交换机故障与天气有关,天气不好,故障就多了,我去了,发现还是信令接口的协议有问题,用7号信令仪器监测,就发现了我们与日本人对于国标的理解不一样,与日本人沟通后,问题解决了。

 

每次交换机出现重启,都是重大问题,需要上报法国总部,并且找出来问题的原因,而我就是事故分析与调查的人,我的经验是没有一次是那么简单的,一次是佳木斯的问题,机器重新启动了,后来分析各种原因,原来是他们放了很多双音频的电话,而他们定的数目双音频记发器有限,而交换机又没有做保护,所以一旦到了白天10:00钟,机器就瘫掉了,而局里的人说是因为来了一位实习生,他在机房操作导致的,要处罚这个实习生,我把交换机的黑匣子得到了,一步步分析,并且在模型机完全重新模拟佳木斯的情况,通过模拟呼叫器来模拟话务量,当话务量加大后,交换机就出来同样的故障了,这个实验结果,可以重现,而且所有的过程与那天出现的过程一致,连故障信息与告警信息也一样,黑匣子的数据比对也一致,铁证如山,证明了交换机本身软件设计有问题,而与实习生的指令操作没有任何关系,我在交换机上面加了一个外围保护软件,量大的时候进入保护状态,同时通知佳木斯电信扩容,就解决了这个棘手的问题了。这个问题被上报到了法国实验室,他们按照我的文件做了同样的实验,也发现了软件本身有问题,而与人员操作无关的。类似这样的问题,在我做电信技术总监的时候,几乎常常碰到。今天先写到这里。

 

 

 

 

 

 

 

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有