从85到6——记HP全球新一代数据中心的整合工程

标签:
hp多活数据中心整合负载均衡it |
分类: 数据中心 |
从2005年到2012年,从全球85个数据中心到3地6中心。HP借助标准化技术以及严格的IT管理体系,打造了支撑全球化业务的新一代数据中心。
文/王晨
二十一世纪初期惠普在全球共有85个数据中心,其中30个数据中心与微软公司共用,区域计算单元约300个,广域网站点1000多个。全球数据中心面积合计超过60000平方米以上,服务器机柜超过13000个,服务器达到20000台以上,共承载9000多个应用。数据中心空间年增长率达到了6%。随着全球化业务的快速部署、企业的并购、业务零时差的运行,分散的数据中心效率底下的问题日益突出,因此2005年HP启动了数据中心整合工程,内部又简称为NGDC工程,该工程于2012年告一段落,最终建成为3地6中心(如图1所示)。
http://www.h3c.com.cn/res/201307/08/20130708_1626775_image001_790133_30008_0.jpg
1 建设进程
http://www.h3c.com.cn/res/201307/08/20130708_1626776_image002_790133_30008_0.jpg
如图2所示,在2005年,HP开始启动数据中心的整合工程。由于整个工程时间计划安排十分紧凑,HP必须充分利用已有资源进行改造。2006年HP完成了休斯敦3号机房的改造,这个机房也是HP当时85个数据中心中最大的一个。2007年,HP并购了一些企业,并将这些企业中的两个数据中心建设改造为奥斯丁1号和亚特兰大5号数据中心。因为是资源利旧,这三个数据中心的改造升级工作进展较快。
同时,在2007年,HP在这三个城市又新建了另外三个数据中心。数据中心整合共计三年,除了休斯敦3号在2006年就已经改造完毕之外,其他5个数据中心均是在边使用边建设的状态下建设完成。由于休斯敦3号和休斯敦4号两个数据中心的距离较近,不符合HP制定的同城中心距离15-20英里(24-30km)的距离标准,因此在2010年HP开始新建休斯敦西部数据中心,替代休斯敦3号机房,也正是这个时候HP引入了H3C网络,以休斯敦西部数据中心为试点,使用了6个月的时间,HP将内部网络设备全部替换成H3C产品。
http://www.h3c.com.cn/res/201307/08/20130708_1626777_image003_790133_30008_0.jpg
事实上,并不是所有的服务器都部署在这6个数据中心内,如图3所示,HP还存在一些针对本地应用而部署的本地计算单元SIM(
目前HP全球有60个左右的SIM,后续会逐步整合到40个区域的RCS中。
2
虽然已经充分整合了IT系统,但HP仍拥有大量的业务系统,数据中心的可用性对HP至关重要。
HP将高可用性分为两种模式:一种是HA高可用性,另一种是业务的永续性。针对同城之间的两个数据中心(同一个Zone,不同Site间)的可用性采用业务永续性的方式,针对不同的区域之间(不同Zone间)则采用灾备方式实现高可用(如图4所示)。
http://www.h3c.com.cn/res/201307/08/20130708_1626778_image004_790133_30008_0.jpg
从应用的角度看,高可用性采用两种模式:一种是同城有两个数据中心,应用在两个数据中心是双活的(Active),在异地的另外一个数据中心做灾备。第二种模式是指系统不支持在同一个城市的两个数据中心实现双活,而是实现在一个数据中心是活的,另一个城市的数据中心也是活的,然后同城的数据中心作为灾备。
为了保证
HP
从0级到2级,这几个级别对于故障恢复和高可用性要求都很高,因此故障恢复是Site to Site之间,采用同城双中心的方式。Tier 3级别的业务对可用性要求不高,主要在本地部署。
灾备方面,只有Tier 0级实现了Zone to Zone的两个不同城市间的异地灾备。
名词解释:Zone、Site、Module、Cell、Pod
HP数据中心采用标准的模块化设计,根据规模可以划分为:
Zone,表示在一个城市中,提供IT服务的区域,其包括1个或多个数据中心站点,在HP数据中心中,其表示在一个城市中的同城双中心;
Site,表示一个物理的数据中心,在HP数据中心中,对应1到6号数据中心,一个数据中心可以由多个建筑物组成。
Module,表示一个数据中心内的一个物理建筑;
Cell,是集服务器、存储和网络于一体的服务单元;Cell能够根据业务的发展进行横向与纵向的扩建。例如在一个数据中心内部,HP建立了4个Cell,其中两个运行相应的应用系统,另外两个便可以等到业务扩容时使用。一个Cell约占地两万五千平方英尺(约2500平方米),对于老的Cell耗电大概是2.4兆瓦,可以承载约2500台服务器,目前HP一个新的Cell耗电是4.8兆瓦,但可以承载约7000台服务器。
POD,在Cell下面是POD数据集装箱的模块,在每次扩展时,可以很快部署一个POD,对业务进行整合并扩展。
3
由于域名很方便修改,HP大量的业务,特别是核心业务均采用WEB、APP、DB架构设计,该架构为HP业务双活提供了前提基础。
双活是指一个应用在同城的两个数据中心的(部分业务)都是活的(Active),这样的应用占HP全球业务数量的1%,即一个应用在Site1是活的,在Site2同样也应是活的,两个Site之上部署全局负载均衡设备,由其来调度流量,将应用灵活的加载到相应的站点上。
负载均衡设备面向公网和HP内网服务,公网或内网用户通过GSLB(全局服务器负载均衡)选择提供业务的Zone和Site,然后再由SLB(服务器负载均衡)为用户选择最佳的服务器实现业务响应。HP在每个Site都部署了4台GSLB(两台部署在广域网出口,两台部署在Internet出口)和50台SLB。大量使用负载均衡设备主要是为了数据中心应用的随时扩展,在HP有的应用可能会产生1600万的并发连接,而通过负载均衡可以随时扩展业务能力(如图5所示)。
http://www.h3c.com.cn/res/201307/08/20130708_1626779_image005_790133_30008_0.jpg
为了确保Internet用户和HP内网用户到这6个数据中心的使用体验,HP建设了高速的核心网并在全球各大运营商租用了高带宽线路。其中Zone与Zone间通过1条10GE光纤互联,形成一个骨干环网,Site与Site间通过3*10GE互联,Site与分支通过3*500GE MPLS互联,Site与Internet通过2*10GE互联,也正是因为在美国具备充足带宽,HP的6个全球数据中心均建设在美国。如图6所示,GSLB部署在每一个Site的骨干路由器边缘或Internet出口边缘,以确保可以第一时间响应来自世界各地的请求,并查询到最佳响应服务器的地址反馈给客户,后续客户的所有数据流量将按照路由计算出的高性能网络进行传输。
http://www.h3c.com.cn/res/201307/08/20130708_1626780_image006_790133_30008_0.jpg
应用层两个Site都是活的(Active),不管那个数据中心发生故障,业务永远都是处于工作状态。目前,HP的站点之间还没有构建大二层网络,业务切换完全是通过域名系统和全局负载均衡来实现的,包括WEB访问APP和APP访问数据库都是通过域名访问的,这样GSLB在两个站点之间可以选择一个最合适的服务器访问(如图7所示)。
http://www.h3c.com.cn/res/201307/08/20130708_1626781_image007_790133_30008_0.jpg
如图7所示,在数据库层,两个数据中心为主备模式(Active-Standby),原因是数据库技术只能支持一个Site的数据是Active状态,通过采用数据同步复制技术,保证了两个中心的数据一致性,当有数据进行写操作时,数据被写到Active的数据中心存储中,同时也复制了一份到Standby的数据中心存储中,一旦Active数据库发生灾难,可以自动或手动启动Standby的数据库,使其变成Active的。
4
HP作为云计算领域的领导者与实践者,在2010年就开始在数据中心中规划云业务,HP的数据中心将会逐步过渡到云中心,进一步的实现资源整合,同时便于全球业务的快速扩展与加强企业间合作。
HP
l
l
l
云计算的应用要求网络可以随云而变,因此为了提高业务的灵活性网络必须具备各种虚拟化能力,HP在数据中心内大量使用了MDC、IRF以及EVI等技术,另外,HP还制定了全网大二层的规划。
http://www.h3c.com.cn/res/201307/08/20130708_1626782_image008_790133_30008_0.jpg
目前HP数据中心内所承载的三类云应用基本分布在不同的Zone,使云资源受限于单个Zone的空间、物理资源。为了使业务与资源解耦合,多个Zone或Site间必须建立多条L2或L3链路,即使数据中心之间增加更多的连接,基于对现网的保护,HP计划在每个Site增加1台S12500核心设备和3条跨Zone的10GE以太网链路,并运行标准的IEEE PBB技术实现骨干网链路虚拟化和层次化,使之具备跨广域的大二层组网能力,满足HP未来业务的大量VLAN需求。在完成PBB组网后,HP 95%以上的设备自动化管理可以通过H3C iMC实现(如图8所示)。
5
HP作为世界上规模最大的IT公司之一,同时作为云计算技术与实践的引领者,其IT应用代表着全球IT应用的一流水平。HP新一代数据中心——NGDC实现了Cisco Free(由思科设备全部替换为H3C设备),HP双活网络均由H3C的网络设备承建。
HP数据网络工程部主管Andy Thiberville将整个整合过程总结为:"HP NGDC最大的成功是其始终坚持不懈的使用标准化技术,以及所执行的严格的IT管理体系"。未来HP将会继续使用标准化技术,如PBB、基于DNS的业务迁移等等,建设多活云中心。