有奖捉虫:行业应用 & 管理与支持文档专题 HOT

背景

同城双活异地多活容灾场景中,灾备资源通常和主力资源部署在不同可用区或不同地域,并归属于不同子网,当发生可用区或地域级别故障时,可以进行容灾切换,为了验证容灾架构的有效性,您可以利用混沌平台“VPC 子网网络隔离”动作将服务主力资源所在子网封禁来模拟因故障造成的资源不可访问情况。

演练准备

同一 VPC 下创建两个子网,并且子网下关联内网 CLB、CVM、CDB 资源,网络拓扑如下,其中主可用区分别关联了两个 CVM、一个内网网关、一个 CDB 实例,备可用区关联了一个 CVM、一个内网网关。同一 VPC 下实例默认网络互通,所以在故障注入前,子网间资源可以互相访问,当封禁主可用区子网时,主可用区子网内实例间仍可正常访问,但外部外访问主可用区子网实例将失败。
?
?
?
注意:
子网网络隔离通过对子网设置网络 ACL 规则实现,存量长连接会被立即断开。
当目标子网存在网络 ACL 规则时,故障注入时,将会临时解绑,并在恢复时重新恢复绑定,演练过程中请勿手动修改或删除网络 ACL 规则。
子网网络隔离不能用来模拟数据库单可用区故障,数据库单可用区故障请参见 数据库相关故障 动作。

演练实施

步骤一:创建演练

1. 登录 腾讯云混沌演练平台 控制台。
2. 在左侧导航栏选择演练管理页面,单击新建演练后,选择创建空白演练。
?
3. 填写完基本信息后,进入演练对象配置,对象类型选择云资源下的 VPC 子网,单击添加实例
?
单击添加实例后,会列出目标地域下所有的 VPC 子网信息,可以根据子网 ID、VPC 实例 ID、标签键筛选符合要求的子网。
注意:
子网网络隔离影响范围较大,请谨慎选择故障注入实例范围。
?
?
?
4. 选择目标子网后,单击立即添加,即可添加演练动作。
?
?
演练动作选择网络隔离
?
5. 单击下一步,可以看到故障动作会自动带出恢复动作。
?
?
?
6. 单击下一步,进入全局配置,全局配置请参见 快速入门,注意子网没有相应基础资源监控指标,确认无误后,单击提交,平台自动进行环境预检,单击跳转演练详情开始演练。
?
?
?

步骤二:执行演练

1. 单击右上角执行开始演练,由于演练为手动推进,所以需要手动执行故障动作。
?
2. 单击故障动作执行,等待故障执行成功。
?
?
?

步骤三:验证注入效果

私有化网络控制台,网络拓扑菜单可以看到网络拓扑已经在相应子网上添加了网络 ACL 规则。
?
测试实例访问,预期故障可用区内子网间实例互访不受影响,子网外访问故障子网内实例失败。
CVM 访问 CVM
同一子网内访问正常
?
不同子网访问失败(命令阻塞)
?
?
?
CVM 访问 CDB
同一子网内访问正常
?
不同子网访问失败
?
CVM 访问 CLB
由于 CLB 禁止了 Ping 探测,所以使用 telnet 对服务端口进行探测。
同一子网访问正常
?
?
?
不同子网访问失败(命令阻塞)
?
?
?

步骤四:执行故障恢复动作

单击执行恢复动作并等待动作执行成功。
?
?
?

步骤五:验证恢复效果

参考步骤三进行验证,预期子网内及子网间实例访问正常。


http://www.vxiaotou.com