有奖捉虫:办公协同&微信生态&物联网文档专题 HOT

背景

Redis 集群是业务存储热数据的重要组件,为保证业务的可用性,依靠集群内节点之间的 Gossip 协议来进行节点状态的判断,默认的心跳超时时间 (cluster-node-timeout) 为15s。如果此故障节点为主节点时,腾讯云Redis将采取故障切换机制,将重新从备节点选举新的主节点。
腾讯云混沌演练平台基于以上特性,提供手动方式跨过节点故障阶段直接模拟HA策略的故障动作,您可通过该手动故障方式模拟当 Redis 集群发生故障切换机制的短时间内对业务的影响。

演练实施

演练准备

准备一台多节点跨 AZ 属性的 Redis 实例。

演练步骤

步骤1:创建演练

登录混沌演练控制台,进入演练管理页面,单击新建演练,填写基本信息
?
?
?

步骤2:添加动作

根据模拟的容灾场景灵活选择主备切换模式:
优先同可用区切换
模拟主节点发生故障时,腾讯云Redis真实HA策略场景:数据最新节点优先提主;数据相同时优先同可用区其他节点选举
优先跨可用区切换
模拟可用区整体故障时,其他可用区节点提主场景
?
?
?

步骤3:执行演练动作

1. 执行演练
?
?
?
2. MFA 校验
?
?
?
3. 执行演练动作
?
?
?

结果观测

故障前节点状态信息
以优先跨可用区模式为例,观察注入故障前后可用区是否变更。
?
?
?
故障后节点状态信息
?
?
?
?


http://www.vxiaotou.com