标签:
杂谈 |
4月20日的时候,银联系统出现故障,从早上10:56开始,直到晚上8点多才恢复正常。从技术的角度来分析,这次故障对于业务支撑是有很重要的借鉴意义。
其一,网络化与集中化的讨论。这方面的讨论似乎一直没有停止过,伴随着系统的建设和成长,也随着一些事件的发生和领导的意志,有时东风压倒西风,有时西风又压倒了东风。银行的支撑系统集中化走在行业发展的前列,当年我们的IT改造在很大程度上也是借鉴了银行方面的经验和技术。从企业管理的角度来说,集中化的系统便于管控,集中化也是移动支撑系统改造的大旗,无论是BSS、OSS还是MIS,均按照集中化的思想进行建设。但是集中化带来一个问题是灵活性可能降低,带来一个隐患就是单点造成的安全,这是从一开始大家就都看到的,所以电信一直在犹豫要不要进行集中化改造。现在,由于移动的BOSS一支独秀加上做秀,电信终于下决心做集中化的系统了。这个时候,银联出了问题,某些专家又觉得应该向电信学习,将星状结构调整为网状结构,以降低风险。应该怎么做呢?
个人认为,面向客户的服务或运营系统,集中化带来的安全问题是一定要关注的。电信网是面向客户运营的系统,所以网络结构应该充分考虑安全可靠性的问题,“电信级”可不是随随便便就能承诺的。但是对于后台支撑系统来说,集中化确实是必要的。比如BOSS,当年只是做后台的计费和结算的时候,集中没有问题;但是面向前台的营业、客服加入到BOSS这个体系的时候,安全问题自不可同日而语。所以在NGBOSS的时候,安全、网络结构是一定要重点考虑的,其中电信网络结构,尤其是信令与交换、双平面等是非常值得借鉴的。
其二,关于容灾。中午还在和同事探讨容灾系统的建设问题。银联是有容灾系统的,但是如果是系统本身出了问题,所谓的容灾系统只不过是复制出来的一个垃圾而已。如果是软件问题,主系统出现故障,备份系统能不出么?所以说简单的容灾系统并不能解决应急的问题,应急方案和机制并不是花一大把银子就能解决的问题。现在一级BOSS已经越来越象银行的系统了,而且未来以此为核心,很多业务受理和鉴权都要借助于这样的平台,今天银联的故障也许明天就会发生在移动。所以这次故障也确实给我们敲响了警钟:安全隐患就在身边,只不过事情没有落在我们的头上,要抓紧有限的时间(从现在到出事)将网络完善,尽快使支撑系统达到电信级的水准。