439  
   0
NAS双活重启主引擎模拟设备故障切换失败解决办法
作者:程辉于 2022年06月21日 发布在分类 / 经验案例 / 经验案例 下,并于 2022年06月21日 编辑
NAS双活 仲裁 ARBITER

1问题描述

产品信息:MS5580G2

软件信息:V1.5.12T04P08_NAS.01P01L03

2套MS5580G2配置NAS双活,配置仲裁,通过NFS共享挂载给CentOS7.5系统,vdbench往挂载目录中持续写入文件模拟IO读写,主引擎GUI上重启2个控制模拟整机故障,vdbench的IO停顿后无法恢复,NAS双活切换失败;

2原因分析

2.1日志分析

●查看日志,发现平台日志中有仲裁与镜像引擎连接失败打印记录

●Warning    2022-06-20 18:23:55    SP2:ARBITER    The current SP can not access arbiter, (arbiter IP>: 10.0.2.105.

●Warning    2022-06-20 18:23:54    SP1:ARBITER    The current SP can not access arbiter, (arbiter IP>: 10.0.2.105.

●Warning    2022-06-20 17:39:23    SP2:ARBITER    The current SP can not access arbiter, (arbiter IP>: 10.0.2.105.

●Warning    2022-06-20 17:39:22    SP1:ARBITER    The current SP can not access arbiter, (arbiter IP>: 10.0.2.105.

●Warning    2022-06-20 17:31:59    SP2:ARBITER    The current SP can not access arbiter, (arbiter IP>: 10.0.2.105.

Warning    2022-06-20 17:31:58    SP1:ARBITER    The current SP can not access arbiter, (arbiter IP>: 10.0.2.105.

查看镜像引擎事件中有镜像状态处于协商状态

●2022-06-20 18:37:45    SP2    镜像    紧急    镜像对是协商状态    镜像对是协商状态,本端LUN是NAS-SYS-LUN-CF,对端节点是0x00b34204-0c9a0019-2e6d874a-609ba903,对端LUN是NAS-SYS-LUN-CF。    否

●2022-06-20 18:37:45    SP2    镜像    紧急    镜像对是协商状态    镜像对是协商状态,本端LUN是NAS-SYS-LUN-MD,对端节点是0x00b34204-0c9a0019-2e6d874a-609ba903,对端LUN是NAS-SYS-LUN-MD。    否

2022-06-20 18:37:45    SP2    镜像    紧急    镜像对是协商状态    镜像对是协商状态,本端LUN是Mirror-LUN-0009,对端节点是0x00b34204-0c9a0019-2e6d874a-609ba903,对端LUN是LUN-0009。


3分析结论

3.1问题原因及影响

双活配置了仲裁,但是其中一台引擎与仲裁通信异常,在做主端关机操作时,镜像状态切换失败导致双活切换失败;

3.2解决方案

1、修复仲裁与所有引擎通信问题,确保仲裁与所有控制器网络可达,仲裁处于运行状态;
或采用非仲裁模式进行测试(计划外故障除外);

2、对于双活测试,如果启用仲裁组网,要确保仲裁与所有控制器通信可达,测试前不仅要检查双活数据同步状态,还要检查仲裁健康状态;


4影响范围

5处理意见

6风险点


 知识评论当前评论数0

 推荐知识


 访问权限

创建人 程辉
工作小组 宏杉成员
文档编辑权限 创建者私有
文档阅读权限 来自分类
分类阅读权限 所有人
分类编辑权限 技术服务部  : 机构     渠道合作伙伴  : 机构     系统管理员 : 人员     
分类审核权限 审核小组  : 岗位    
分类预览权限 审核小组 : 岗位    
分类下载权限 技术服务部  : 机构    
 历史版本

修改日期 修改人 备注
2022-06-21 15:49:08[当前版本] 程辉 CREAT

 目录
    宏杉案例知识库-V4.0.1