微信号:dellemc_tech

介绍:为戴尔易安信客户提供技术支持服务,为广大IT行业用户分享技术文章与行业信息。

RecoverPoint拷贝测试、生产数据恢复和故障切换的实践

2017-01-20 17:30 EMC中文技术社区

本文是【专家问答】神奇备份在哪里--RecoverPoint 篇中的嘉宾分享文章总结。

 

 

测试拷贝:


RecoverPoint的其中一项关键功能就是能够测试生产数据的时间点快照(Point-in-time Snapshot)。正常复制时,主机会向一致性组(Consistency Group)的生产卷写入数据。所写入的这些数据会编译成一份快照存储在拷贝的日志卷(Journal)中。一份快照可以包含一项或多项写入数据,具体取决于一致性组设置的策略。

 

如果要验证拷贝是否可靠一致,可以通过选择时间点快照,然后使用灾备站点的主机进行访问。具体请见以下步骤:

 

1. 登录图形化管理界面,选择Recovery-->Test a copy。


2. 在Select a copy界面,选择一个一致性组。然后选择一个非生产的拷贝。


3. 点击按钮” Next Select an Image”。


4. 选择一个你想测试的时间点快照,或选择最新的快照。同时,选择测试的模式(Image access mode)。


    模式:

    Logged access(physical):适用于测试时需要读写较多的数据。

    Virtual access:适用于测试时只需要读写少量数据。


5. 点击按钮“Next Test the image”。


6. 测试之前, 请等待“Enable access to the image to test”完成。这段时间内,数据会回滚到选择的时间点。如下图所示,“Enable access to the image to test”完成后, 左边会出现绿色的勾。

 

 


7. “Enable access to the image to test”完成后,将拷贝卷挂载到灾备站点的主机上。


测试时, 请监控“Image access log capacity”和“Journal Capacity”, 界面会显示它们的使用情况(如上图所示)。


“Image access log capacity”:默认的情况下,这部分占用日志卷的20%,它会记录测试时写入的数据。当它100%时,测试会被终止。因此,如果您想测试更长的时间, 请在它达到100%之前,选择增加日志卷、撤销写(Undo Writes)、转变成Direct access(Enable Direct Access)。


“Journal Capacity”:请避免其达到100%, 不然复制会出现“Error”。如果您想测试更长的时间,请在其100%之前,选择增加日志卷。


注意,在选择撤销写之前,请关闭所有使用拷贝卷的应用,卸载拷贝卷。写撤销之后,重新将要拷贝卷挂载到灾备站点的主机上继续测试。


另外,当选择转变成Direct access之后,将不可以回滚到之前的快照。如果测试时生产站点发生数据损坏,在测试时写入的新数据也不可以被删除除非有其他的拷贝。


8.点击按钮“cancel“将会终止测试。点击按钮”save&close”会退出当前界面,但是测试不会被终止。可以前往“Manage Recovery”继续监控测试情况。


9. 测试终止之前, 请关闭测试时的应用,并且卸载测试卷。


10. 终止测试。


Logged access(physical)和Virtual access:测试终止之后,所有测试中新写入的数据会被丢弃。


Direct access:测试终止之后,日志卷会被清空,生产站点的数据会与灾备站点的数据进行全同步(full sweep)。

 


恢复生产数据:

 

借助RecoverPoint, 可以在发生文件或逻辑损坏后恢复生产数据。生产数据可以回滚到以前的时间点。具体请见以下步骤:

 

1.登录图形化管理界面,选择Recovery-->Test a Copy and Recover Production。


2. 在Select a copy界面,选择一个一致性组。请选择一个非生产的拷贝。


3.点击按钮“Next Select an Image”。


4. 选择一个你想测试的快照,或选择最新的快照。同时,选择测试的模式。


5.点击按钮“Next Start Recovery”。


6. 进入“Start Recovery”界面。

 

 

7.测试之前, 请等待“Enable access to the image to test”完成。


8. “Enable access to the image to test”完成后,将拷贝卷挂载到灾备站点的主机上。


测试时,请监控“Image access log capacity”的状态和“Journal Capacity”的状态。


注意,在选择撤销写之前,请关闭所有使用拷贝卷的应用,卸载拷贝卷。写撤销之后,重新将要拷贝卷挂载到灾备站点的主机上继续测试。


9.点击按钮“cancel“将会终止测试。点击按钮”save&close”会退出当前界面,但是测试不会被终止,可以前往“Manage Recovery”界面继续监控情况。


10.点击按钮“Finish” 将会终止测试并且开始恢复生产。在这之前, 请先在灾备站点的主机上卸载拷贝卷。


在“Manage Recovery”界面,可以看到复制方向发生改变,变成从灾备到生产,这表明正在恢复生产站点的数据。恢复完成后,生产站点的日志卷中的数据会被清空。复制方向恢复到原来的从生产到灾备。

 


故障切换:

 

通过将一致性组故障切换到某个本地拷贝或某个远程拷贝,可使系统凭借该拷贝照常继续操作。快照现在将从(原先的)拷贝传输到(原先的)生产日志,再从生产日志传输到生产存储。生产存储恢复完毕或计划内维护完成后, 可以通过再次执行故障切换在原始生产站点恢复系统操作。

 

具体请见以下步骤:

 

如果一致性组中只有一份拷贝,在开始以下步骤之前, 请安全地关闭生产站点Windows主机活动,并且确保文件系统已经推送到生产卷,文件系统的最新快照已经生成。一些应用,比如Exchange,有自己的缓存,也需要进行推送。在生产站点,关闭所有使用一致性组中卷的应用。并将一致性组的卷设置为offline。

 

1.登录图形化管理界面,选择Recovery-->Test a Copy and Fail Over。


2. 在Select a copy界面,选择一个一致性组。请选择一个非生产的拷贝。


3.点击按钮“Next Select an Image”。


4. 选择一个你想测试的快照,或选择最新的快照。同时,选择测试的模式。


5.点击按钮“Next Start Failover”。


6.进入“Start Failover”界面。

 

 

7.测试之前, 请等待“Enable access to the image to test”完成。


“Enable access to the image to test”完成后,将要拷贝卷挂载到灾备站点的主机上。


测试时,请监控“Image access log capacity”的状态和“Journal Capacity”的状态。


注意,在选择撤销写之前,请关闭所有使用拷贝卷的应用,卸载拷贝卷。写撤销之后,重新将要拷贝卷挂载到灾备站点的主机上继续测试。


8. 点击按钮“cancel“将会终止测试。点击按钮”save&close”会退出当前界面,但是测试不会被终止。


9. 当测试完成后,如果一致性组中只有一份拷贝,请从灾备站点的主机上卸载拷贝卷。


10. 点击按钮“Finish”, 故障切换开始。


如果一致性组中只有一个拷贝,生产的日志卷和拷贝的日志卷会被清空, 一致性组会进行全同步(full sweep),然后复制会开始。此时,可以看到复制方向是从灾备站点到生产站点。


如果一致性组中的拷贝多于一个, 会跳转到“Manage Recovery”界面。您可以修复生产站点的问题,同时您可以在拷贝站点上运行应用程序。结束之后,您可以选择切换回去或者将拷贝设置为新的生产。

 

 

管理测试、恢复生产和故障切换:

 

我们可以使用“Manage Recovery”界面监管测试、恢复生产和故障切换。

 

测试拷贝:

 

我们可以看到如下界面。在这里我们可以监控“Image access log capacity”的状态和“Journal Capacity”的状态。Next Action中有两个选项:Continue Testing和Finsh Testing。

 

 

如果选择Finish Testing, 则测试会被终止。

 


 


生产恢复:

 

在测试阶段点击按钮“Save&Close”,可以进入以下界面。但是, 在这里只有“Back to Wizard”的选项。

 


点击“Back to Wizard”,回到之前的界面。



 


故障切换:

 

当一致性组中有超过一份拷贝,我们认为是暂时性切换。比如, 我们有一个一致性组Edgar, 它有两个拷贝,一个在生产站点(local), 一个在灾备站点(DR)。现在我们进行从生产站点(Prod)到灾备站点(DR)的切换。

 

 

故障切换后,复制方向发生改变,现在是从DR到Prod。此时,Next Action中有两个选项:切换回原来的生产(Fail back to Production)和设置拷贝为新的生产(Set Copy as Production)。

 

 


切换回原来的生产(Fail back to Production):


1. 当生产站点故障修复后,可以选择“Fail Back to Production“。


2. 转入” Select an Image“界面。您可以选择一个您想要切换回去的快照。


3. 点击按钮”Finish“之后,生产站点的日志卷会被清空。从Prod到local的复制会自动恢复。从Prod到DR的复制也会开始。

 


设置拷贝为新的生产(Set Copy as Production):


1. 在原来的生产站点主机上,关闭使用拷贝卷的应用,卸载拷贝卷。


2. 选择设置拷贝为新的生产(Set Copy as Production)。


3. 因为还有一个local,所以会有“Set Production”界面跳出,询问如何处理local


拷贝:


如果您想继续使用local, 可以选择配置一个新连接。“Disable Copy“会保留local中的数据和配置。”Remove Copy“会删除local中的数据和配置。

 

 

4. 新的生产站点的日志卷会被清空。

 


更多精彩内容,请点击阅读原文”进行查看!

如何每天都能收到如此精彩的文章?

①点击右上角点击查看官方账号”→点击关注

②长按并识别下图中的二维码,直接访问EMC中文支持论坛


 
戴尔易安信技术支持 更多文章 这部看哭无数人的电影让小编想到一个词——Unity 老板让我干完这个月就辞职 特大号这篇文章让万千售前沸腾啦 VxRail打好基础,未来6000个VDI也毫不惧怕 三位20多年的IT老兵在聊存储,干货多,速来!
猜您喜欢 一位考上清华的学霸,给中国父母的8个忠告 关于数据库优化的一些感想和建议 通过Playground展示一些编码模式 Git相关分享 用PyInstaller将python程序转成exe文件执行