29、使用IBM服务器可能导致ESXi/ESX 4.1服务器HBA卡和PCI设备停止响应
故障状态:
当使用IBM x3650 M3或BladeCenter HS22V服务器时,可能会在ESXi/ESX 4.1上遇到下面的问题:
1、HBA卡停止响应;
2、某些PCI设备无响应;
3、可以在ALT+F12界面和日志信息里看到这样的信息:
vmkernel: 6:01:34:46.970 cpu0:4120)ALERT: APIC: 1823: APICID 0x00000000 – ESR = 0x40
4、HBA卡停止响应,例如:
vmkernel: 6:01:42:36.189 cpu15:4274)<6>qla2xxx0000:1a:00.0: qla2x00_abort_isp: **** FAILED ****
vmkernel: 6:01:47:36.383cpu14:4274)<4>qla2xxx 0000:1a:00.0: Failed mailbox send register test
5、HBA卡可能进入离线状态,例如:
vmkernel: 6:01:47:36.383 cpu14:4274)<4>qla2xxx 0000:1a:00.0: ISP error recovery failed – board disabled
故障分析:
具体问题还不太清楚,期待VMware官方能够给出解释并放出相关补丁;
解决方案:
在ESXi/ESX 4.1里面雀圣启用了中断重映射代码,而这个代码和部分IBM服务器不兼容,可以通过禁止掉这个代码缺省启动的方式来临时解决这个问题:
1、进入到命令行界面,执行如下命令:
#esxcfg-advcfg -k TRUE ioDisableIR
#init 6
2、重启后检查这个选项是否依然缺省启动:
#esxcfg-info -c
iovDisableIR=TRUE
备注:这就表示缺省没有启动;
也可以利用vSphere Client登录到服务器的GUI进行修改 |