一、问题描述
MS3000G2设备,版本V1.2.21T01P06,前端对接VMware虚拟化,客户反馈部分VMware虚拟化业务性能卡。
二、过程分析
查看存储message日志打印如下,message中存在大量的Dio timeout!,id:27表示超时的LUN的id号为27
在timeout附近时间点在message看到有如下打印,disk[0-0-39-0]表示acsl号为0:0:39:0的磁盘,timed out: ODSP_EH_NOT_HANDLED表示acsl号为0:0:39:0的磁盘存在命令超时
在series_lun.xml文件中查看LUN id 为27的LUN的名称为LUN-hlwjrq-4,该LUN属于RAID-1
在series_disk.xml文件中查看acsl号为0:0:39:0的磁盘号为1:1:2:6,根据上图可以看出1:1:2:6属于RAID-1
结合以上分析磁盘1:1:2:6命令超时导致RAID-1中的LUN-hlwjrq-4业务IO超时,从而导致上层业务卡顿。
三、解决方法
更换磁盘 1:1:2:6
四、风险提示
更换慢盘,该RAID中若无其他隐患磁盘,建议通过拔盘处理,慢盘进行迁移重建可能会出现重建时间较长问题。
五、关键字
慢盘,timeout,性能
创建人 | 张雷刚 |
文档编辑权限 | 创建者私有 |
文档阅读权限 | 来自分类 |
分类阅读权限 | 所有人 |
分类编辑权限 | 技术服务部 : 机构 渠道合作伙伴 : 机构 系统管理员 : 人员 |
分类审核权限 | 审核小组 : 岗位 |
分类预览权限 | 审核小组 : 岗位 |
分类下载权限 | 技术服务部 : 机构 |
修改日期 | 修改人 | 备注 |
2021-08-02 17:05:01[当前版本] | 张雷刚 | CREAT |
附件类型 | PNG |
|