一、组网图
不涉及
二、问题描述
存储版本为:1.2.18T03P01,在存储端进行在线lun强制取消关联操作,在存储GUI执行完取消关联操作后,存储GUI界面出现hang住,未返还执行成功页面,随后执行取消关联lun操作;由于GUI界面hang住,用户在本地执行关闭存储GUI进程操作。重启存储GUI发现lun已取消关联成功,随后客户尝试把取消关联失败的lun关联到原来客户端操作识别,报webservice调用错误。
三、过程分析
1、尝试导出日志供后端进一步分析,但发现日志无法导出,命令行执行一键收集诊断信息报错。
2、通过日志分析发现为强制取消关联LUN的时候,前端有流量下发,导致存储端有io命令没有释放,该问题为当前版本bug。
Feb 27 17:31:44 00:B3:42:0F:B6:ED kernel: fc_TPG[0] - Freeing ACL for fc InitiatorNode: 21:00:f4:e9:d4:54:1f:a1 Mapped LUN: 4 Feb 27 17:31:44 00:B3:42:0F:B6:ED kernel: fc_TPG[0]_LUN[21] - Removed ACL for InitiatorNode: 21:00:f4:e9:d4:54:f2:ef Mapped LUN: 4 Feb 27 17:31:44 00:B3:42:0F:B6:ED kernel: fc_TPG[0] - Freeing ACL for fc InitiatorNode: 21:00:f4:e9:d4:54:f2:ef Mapped LUN: 4 Feb 27 17:31:44 00:B3:42:0F:B6:ED kernel: =============cmd opcode: 0x89, se_cmd_flags: 0x811, unpacked_lun: 0x15, cmd=ffff8801b41dc040 Feb 27 17:31:44 00:B3:42:0F:B6:ED kernel: =============cmd opcode: 0x89, se_cmd_flags: 0x811, unpacked_lun: 0x15, cmd=ffff88012b140040 Feb 27 17:31:44 00:B3:42:0F:B6:ED kernel: ===============2 cmds in list Feb 27 17:31:45 00:B3:42:0F:B6:ED kernel: __ratelimit: 2218 callbacks suppressed Feb 27 17:31:45 00:B3:42:0F:B6:ED kernel: ODSP:MSG:TCM: TARGET_CORE[fc]: Detected NON_EXISTENT_LUN Access for 0x00000009 Feb 27 17:31:46 00:B3:42:0F:B6:ED kernel: ODSP:MSG:TCM: TARGET_CORE[fc]: Detected NON_EXISTENT_LUN Access for 0x00000009 Feb 27 17:31:46 00:B3:42:0F:B6:ED kernel: ODSP:MSG:TCM: TARGET_CORE[fc]: Detected NON_EXISTENT_LUN Access for 0x0000000e
四、解决方法
1、可以通过尝试重启SP1控制器解决该问题。
2、可以通过将升级版本升级到1.2.27T05P09及以上版本彻底解决。
五、风险提示
出现问题后,需要反馈宏杉技术人员来确认需要重启的控制器;
重启控制器需要经客户同意后方可操作。
六、关键字
强制取消关联LUN,webservcie错误,无法收集日志
修改日期 | 修改人 | 备注 |
2019-03-06 09:59:34[当前版本] | 张奎呈 | 通过日志分析发现为强制取消关联LUN的时候,前端有流量下发,导致存储端有io命令没有释放,该问题为当前版本bug。 |
2019-03-06 09:57:22 | 张奎呈 | CREAT |