有奖捉虫:行业应用 & 管理与支持文档专题 HOT
文档中心 > 混沌演练平台 > 故障动作库 > 容器 > 容器资源 Pod 操作故障演练案例

背景

Pod 是 Kubernetes 集群中运行的应用程序的最小部署单元。在实际应用场景中,Pod 可能存在容器崩溃、资源不足、Pod 销毁、Pod failure 等故障,导致应用程序无法正常运行。
为了提高容器服务的可靠性和稳定性,需进行 Pod 故障演练。通过演练,可以验证系统在 Pod 故障的情况下是否可以正常运行,提前暴露在此故障场景下的一系列问题,以便于快速有效地解决。

演练实施

步骤一:演练准备

购买容器实例,部署测试服务。若已有可以演练的容器实例,则直接创建演练。
进入 探针管理 页面安装探针。

步骤二:创建演练

1. 登录 混沌演练控制台,进入演练管理页面,单击新建演练
?
?
?
2. 点击跳过,新建空白演练。
?
?
?
3. 实例类型选择容器,实例对象选择标准集群Pod, 然后添加实例。
?
?
4. 添加故障动作。点击立即添加,选择Pod操作。
?
?
5. 选择故障动作。
?
?
6. 设置动作参数,点击确定
?
?
7. 动作参数配置完成之后,单击下一步。根据实际情况配置护栏策略监控指标,最后单击提交,完成演练创建。
?
?

步骤三:执行演练

1. 查看故障执行前 Pod 的信息。可以发现 Pod 是 2023-08-18 创建的,并且已经运行 2 天。
?
?
2. 进入演练详情,单击前往动作组执行
?
?
?
3. 点击执行,开始演练。
?
?
4. 查看动作执行结果详情。
?
?
5. 查看执行日志,确认执行成功。
?
?
6. 验证执行效果。查看故障执行后 Pod 的信息。可以发现 Pod 是刚刚创建出来的,也就是说,之前的 Pod 已经被删除,重建了一个新的 Pod。
?
?


http://www.vxiaotou.com