VM虚拟化环境上的数据库集群配置错误导致数据库异常宕机-宏杉案例知识库

969

VM虚拟化环境上的数据库集群配置错误导致数据库异常宕机

作者:张奎呈于 2019年05月08日 发布在分类 / 经验案例 / 经验案例 下,并于 2019年05月08日编辑

DID_BAD_TARGET Vmware 宕机

一、组网图

不涉及

二、问题描述

双活存储私有链路闪断后，vm平台上的数据库集群异常宕机，数据库使用的硬盘空间为VM平台从存储上切割出来的虚拟磁盘。

三、过程分析

1、分析存储日志，发现数据库对应时间段存储端出现私有链路闪断，且数据库所占用的磁盘空间对应的双活LUN对应此闪断私有链路：

2019-05-04:17:08:49:0x13700001:SP2:DEVICE_PAIR:Warning:Device pair's link state has changed from UP to DOWN,<remote device>: Storage-old, <link id>: 2.
2019-05-04:17:08:57:0x13800001:SP2:MIRROR:Warning:Mirror status becomes unsynchronized, <Local LUN>: LUN-SSD-8T.
2019-05-04:17:09:40:0x3700001:SP2:DEVICE_PAIR:Info:Device pair's link state has changed from DOWN to UP,<remote device>: Storage-old, <link id>: 2.
2019-05-04:17:09:45:0x3800001:SP2:MIRROR:Info:Automatically start synchronizing for mirror successfully, <primary LUN>: LUN-SSD-8T, <mirror LUN>: LUN-SSD-8T.
2019-05-04:17:09:45:0x3800001:SP2:MIRROR:Info:The status of mirror becomes synchronized, the data of mirror becomes consistency, <primary LUN>: LUN-SSD-8T, <mirror LUN>: LUN-SSD-8T.
2019-05-04:17:10:26:0x13800001:SP2:MIRROR:Warning:Mirror status becomes unsynchronized, <Local LUN>: LUN-SSD-8T.

2、分析数据库所在虚拟机日志，对应时间段虚拟机磁盘报错：

且报：hostbyte=DID_BAD_TARGET，初步判断scsi总线共享方式为“物理”

3、分析数据库日志，发现对应时间点1分钟后数据库报错

4、查看DB2群集共享磁盘方式，现场检查确认scsi总线共享方式为“物理”，该种共享模式下虚拟机对磁盘的延时响应较为敏感，对于DB2等数据库业务，磁盘响应时间稍长将导致双机故障，需要在linux虚拟机中将磁盘超时参数修改为：5：

5、综合判断为：现场对应时间段私有链路1、2存在异常，初步分析由于私有链路闪断导致磁盘响应时间较平常时间长，由于DB2双机scsi共享总线方式为“物理”，对磁盘延时较为敏感，进而导致DB2数据库宕机。

四、解决方法

1、在前端业务量较小时，排查定位并解决现场私有链路闪断问题。
2、调整DB2虚拟机中的磁盘超时参数：echo "5" > /sys/block/sdb/device/timeout。

五、风险提示

当前端存在在vm平台搭建集群时，如scsi共享总线方式为“物理”，必须调整对应虚拟机内的磁盘超时参数为5：echo "5" > /sys/block/sdb/device/timeout；否则存储端出现重启、接管、反转等情况时，对应虚拟机业务必断。

六、关键字

DID_BAD_TARGET，Vmware，宕机

知识评论当前评论数0条

创建人	张奎呈
文档编辑权限	创建者私有
文档阅读权限	来自分类
分类阅读权限	所有人
分类编辑权限	技术服务部 : 机构渠道合作伙伴 : 机构系统管理员 : 人员
分类审核权限	审核小组 : 岗位
分类预览权限	审核小组 : 岗位
分类下载权限	技术服务部 : 机构

修改日期	修改人	备注
2019-05-08 16:26:42[当前版本]	张奎呈	格式调整
2019-05-08 16:26:10	张奎呈	CREAT

附件类型	JPG PNG
db.png(35009.0b) scsi.jpg(178034.0b) vm.png(66868.0b)

[Title]