案例:移动通信公司的数据保护系统升级
-----利用Mirage™的高速度和离线级数据安全保障
业务系统现状
需保护的主要数据库为:
- 营帐数据库,数据量1 TB左右
- 计费数据库,数据量1.5TB左右
已有STK L180磁带库作为备份设备,逐日备份当天的数据变化,并将备份复制三份,以防止备份因磁带故障而失效。正在筹建容灾系统以进一步保障业务连续性。
升级原因
国际公认的Share 78标准将容灾分为七级,备份是第一级和基础,须首先完善,否则其他措施均有沙地建楼之虞。然而目前的备份系统尚有隐患,主要是受限于磁带驱动器的速度(即使采用压缩备份,实用速度仍很难超过150GB/小时),营帐数据的全备份需要近7个小时,计费数据的全备份需要10个小时以上,而7×24的移动通信业务不允许这样长的备份窗口:
目前的做法是只做逐日增量备份,虽然能保证原始数据的安全性,但出现重大灾难后数据库的重建会极其耗时(术语为“超长RTO”):业务要求在线保存6个月数据以便应对用户随时查询,通过逐日增量重构这样的数据库预计很可能耗时以周计,风险很大;
欲同时利用既有STK180的三个驱动器备份以提高速度,则须将同一数据库分成4个并行任务同时往4盘磁带上写(= RAIT 0),备份失效的风险较单一磁带串行备份高出4倍。且复制磁带不能降低该风险——因为复制用的母磁带的可靠性已堪怀疑;
容灾系统的建立是为了解决业务连续性问题,对保护数据(或曰应对数据的管理风险—— 也即人为无意/有意误操作,病毒,应用运行出错,偶发代码冲突等“软风险”导致的数据损坏)并无任何帮助:举例说:X用户的误操作导致了A数据库的第n张表被误更改,直到若干周后,Y用户使用A数据库时因恰好要调用第n张表,才发现无法正确调用,此时容灾复制的数据对于恢复正确数据没有任何帮助,因为此前复制的数据本身是错误的。
Mirage™升级方案
1.将Mirage™放置在容灾中心,通过长波光纤(可支持10公里距离)接入生产中心既有交换机,整个升级过程与容灾项目一起进行,无需对现有网络做任何变更;
2.一级日常备份/恢复在Mirage™上进行(2周保护周期,仅需8TB的Mirage™容量)。营帐数据库全备份仅需2小时左右,计费数据库全备份仅需3小时左右(放在不同的周末进行),全备份操作对7×24运营的应用系统的影响完全降至业务系统可承受范围;
3.正常上班时间将Mirage内备份克隆到既有STK180中,利用既有的2个驱动器并行拷贝2份(而非彼此复制),以确保生成的磁带均具备源数据母带的可靠性,作为二级备份/灾备。二级备份亦可利用备份软件自动调用/恢复
4.需要恢复数据库时,备份软件从Mirage中调用一级备份(2周内),或从STK180中调用二级备份(2周-12周),在充分利旧的前提下,保障3个月的总体数据保护周期。
【注】
若后续业务扩展需要更高的备份速度,只需以本方案相同的方式接入第二个Mirage™即可——其逻辑与传统机械磁带库增加驱动器个数无异。

用户收益显著
1.数据库的全备份时间均降至3小时以下:用户得以采用“周期性全备份+逐日数据表Export”的标准数据保护方式,发生数据库灾难时数据库重构时间可锐减至24小时以下;
2.备份数据的可靠性大大增加:Mirage™采用容错介质且具备离线级的数据安全性,从其上复制的2盘磁带基本等同于从源数据复制;
3.升级方式经济、简明、便利:在充分利旧的同时完成了本不可或缺的灾难备份自动化。
4.彻除系统维护压力:a)Mirage™为全封闭纯电子系统,不受环境影响;b)Mirage在降级状态下仍可正常工作,同时能够在线自动热恢复; c)管理员可在任何地方通过网络登陆,监控Mirage工作情况;d)维护(更换磁盘)可自行进行,无修复周期之虞。
