问题描述:
Disk0,1(sata)组了个raid0,Disk2,4,5(sata)是jbod。Disk8-11是nvme。
对Disk0 (RAID0的一个sata)进行热插拔之后,Disk8就跑到raid卡下面了,而且Disk8的接口类型变成了sata,点定位灯也会报错。重启BMC也不会恢复。
请问该问题应如何定位?
问题描述:
Disk0,1(sata)组了个raid0,Disk2,4,5(sata)是jbod。Disk8-11是nvme。
对Disk0 (RAID0的一个sata)进行热插拔之后,Disk8就跑到raid卡下面了,而且Disk8的接口类型变成了sata,点定位灯也会报错。重启BMC也不会恢复。
请问该问题应如何定位?
麻烦提供一份热插拔之后的一键式收集日志
信息同步: 请确定一下Raid卡官方发布文档,是否支持管理NVME盘,从我这边得到的信息目前:SP686C Raid 卡不支持管理NVME盘,会导致硬盘管理混乱
NVME盘没有插在raid卡下面。
raid下有五个sata盘:Disk0,1(sata)组了个raid0,Disk2,4,5(sata)是jbod。
Disk8-11是nvme,没有接raid。
日志无法贴到社区,请问如何提供
可以联系PAE
是的 点灯流程中,不能手动点其他盘的定位灯,会干扰定位流程,定位流程每次只会点一个盘的灯,并读取盘的定位灯状态来确定是否bmc侧的盘和带内raid卡的管理的盘是同一个,之所以重启bmc也未恢复是因为映射关系做了复位持久化,在os下电情况下,raid卡定位过的盘依然能显示在raid卡下
那请问出现问题后要如何恢复?
OS做了电源循环,也没有恢复
需要AC一下 BMC侧cli命令ipmcset -t maintenance -d accycle
请问什么时候BMC才会执行raid卡下硬盘定位流程?我看有一个定时任务update_pd_list,为什么在执行该任务的时候不会把之前异常识别到raid下的硬盘移除?
点灯时候会优先从持久化数据中拿(复位持久化), AC之后应该就没有这个持久化数据了,会重新定位。
是会一直更新pd_list,这个主要是用于插拔硬盘的校验,插拔了硬盘会重新定位,已定位过的映射不会再更新
这样错误识别过的硬盘就会一直错误显示在raid下面,整机AC对客户来说代价太大。
请问对这种情况后续有没有计划优化
一是要防止定位流程中,用户手动点灯干扰了定位
二是错误定位了后,除了AC 可以通过拔盘也可以取消映射
一是要防止定位流程中,用户手动点灯干扰了定位
二是错误定位了后,除了AC 可以通过拔盘