(1)FC-SW异常重启导致主机和存储FC单边链路中断,FC-SW恢复正常后1台ESXi6.0主机与MS5520存储无法建立连接。
(2)该台ESXi6.0主机与EMC Unity连接正常,其他ESXi6.0主机和MS5520存储/Unity存储连接正常。
(1)FC-SW端检查 , 主机和存储FC端口端口状态已恢复正常,FCID/WWPN/WWNN均已可正常识别,说明FLOGI/PLOGI阶段已完成。
(2)存储诊断日志信息显示,主机和存储FC端口在 Target State Authenticate阶段异常终止,导致PRLI(ProcessLogin)异常终止。
May 22 11:43:00 00:B3:42:01:35:5A eventd: ODSP:MSG:EVENT: event..., event<fc_link_status_change> is: 0.000000 seconds May 22 11:43:00 00:B3:42:01:35:5A kernel: ==fiPlogiHandler,lgnGetInfoState is 3,rPort=140100,rWWPN= 0 May 22 11:43:00 00:B3:42:01:35:5A kernel: ==fiFc2StateLogin,lgnGetInfoState is 1,rPort=140100,rWWPN=10000000c9b8a120 May 22 11:43:00 00:B3:42:01:35:5A kernel: ==fcLgnOpen,hpLgnScsiFcpTarget,lgnGetInfoState is 3,rPort=140100,rWWPN= 0 May 22 11:43:00 00:B3:42:01:35:5A kernel: ==fiFc4TimerEvent,lgnGetInfoState is 3,rPort=140100,rWWPN= 0 May 22 11:43:00 00:B3:42:01:35:5A kernel: ==PRLI.fcLgn4 rWWPN4=10000000c9b8a120,rPort=140100 May 22 11:43:00 00:B3:42:01:35:5A kernel: ==come into ft_prli function May 22 11:43:00 00:B3:42:01:35:5A kernel: ==It will apply session May 22 11:43:00 00:B3:42:01:35:5A kernel: ==FC session connected,Target port:500b342001355a04,Initiator:10000000c9b8a120 May 22 11:43:00 00:B3:42:01:35:5A kernel: ==fiFc4TgtStateLogin,lgnGetInfoState is 1,rPort=140100,rWWPN=10000000c9b8a120 May 22 11:43:01 00:B3:42:01:35:5A kernel: ==fiFc2StateAuthenticate,lgnGetInfoState is 2,rPort=140100,rWWPN=10000000c9b8a120 May 22 11:43:01 00:B3:42:01:35:5A kernel: ==fiFc4TgtStateAuth,lgnGetInfoState is 2,rPort=140100,rWWPN=10000000c9b8a120 May 22 11:43:01 00:B3:42:01:35:5A kernel: ==fiFc2StateOpen,lgnGetInfoState is 3,rPort=140100,rWWPN=10000000c9b8a120 May 22 11:43:01 00:B3:42:01:35:5A kernel: ==fiFc2StateClosing,lgnGetInfoState is 4,rPort=140100,rWWPN=10000000c9b8a120 May 22 11:43:01 00:B3:42:01:35:5A kernel: ==fiFc4TgtStateClosing,lgnGetInfoState is 4,rPort=140100,rWWPN=10000000c9b8a120 May 22 11:43:01 00:B3:42:01:35:5A kernel: ==fiXchgProcessLogindown,prli_count=1 May 22 11:43:01 00:B3:42:01:35:5A kernel: ==Logindown,busyXchgList=3 May 22 11:43:01 00:B3:42:01:35:5A kernel: ==FC session disconnected,Target port:500b342001355a04,Initiator:10000000c9b8a120(3)存储诊断日志信息显示,主机和存储FC端口在 Target State Authenticate阶段异常终止,导致PRLI(ProcessLogin)异常终止。
(4)FC协议出于数据安全考虑,允许在PRLI登录阶段加入端口信息认证环节(可选项),
(5)端口认证阶段,需要确保端口的端口Port名称/Node名称和FCID信息与FLOGI/PLOGI阶段获取的信息要全部核对正确。
(6)FC交换机重启后链路震荡恢复正常过程中,有大量的端口要同时并发进行交互登录,异常链路因出现端口信息认证失败导致未正常恢复。
(7)存储Target端口是被动响应者, 主机端Initiator作为主动发起者,在链路异常恢复过程中应当具备充分的容错和可靠机制,对PRLI登录成功负责。
(8)FC链路建立过程中,芯片和FW已分别完成速率协商和链路初始化,FLOGI/PLOGI/PRLI/IO处理应该有驱动层实现,将问题范围进一步缩小至FC HBA驱动层。
(9)Emulex(被Broadcom收购)官网(https://docs.broadcom.com/docs/13357189)有公布驱动bug会导致PRLI登录异常,引导客户升级驱动版本解决。
(1)如果条件允许,建议拔插链路存在异常的主机端FC端口光纤重新触发PRLI。
(2)客户为防止FC光纤拔插导致较多数量RSCN,不允许拔插光纤,可通过FC-SW端将主机端口从异常链路对应的ZONE中移除再重新添加方式恢复。
(3)宏杉存储正式发布的1.2.27T05之后版本,取消PRLI登录阶段端口信息认证环节,在FC链路震荡等异常情况,增加PRLI阶段端口互联的成功率,可协调升级存储版本解决。
无。
FC PRLI Linkdown,Emulex
创建人 | 刘渊 |
文档编辑权限 | 创建者私有 |
文档阅读权限 | 来自分类 |
分类阅读权限 | 所有人 |
分类编辑权限 | 技术服务部 : 机构 渠道合作伙伴 : 机构 系统管理员 : 人员 |
分类审核权限 | 审核小组 : 岗位 |
分类预览权限 | 审核小组 : 岗位 |
分类下载权限 | 技术服务部 : 机构 |
修改日期 | 修改人 | 备注 |
2019-09-27 14:30:07[当前版本] | 刘渊 | 字体及格式调整 |
2019-06-20 12:13:49 | 刘渊 | CREAT |
附件类型 | PNG |
|