SP686Craid卡下硬盘异常问题

问题描述:
Disk0,1(sata)组了个raid0,Disk2,4,5(sata)是jbod。Disk8-11是nvme。
对Disk0 (RAID0的一个sata)进行热插拔之后,Disk8就跑到raid卡下面了,而且Disk8的接口类型变成了sata,点定位灯也会报错。重启BMC也不会恢复。

请问该问题应如何定位?

麻烦提供一份热插拔之后的一键式收集日志

信息同步: 请确定一下Raid卡官方发布文档,是否支持管理NVME盘,从我这边得到的信息目前:SP686C Raid 卡不支持管理NVME盘,会导致硬盘管理混乱

NVME盘没有插在raid卡下面。
raid下有五个sata盘:Disk0,1(sata)组了个raid0,Disk2,4,5(sata)是jbod。
Disk8-11是nvme,没有接raid。

日志无法贴到社区,请问如何提供

可以联系PAE

目前发现Disk8对应的Drive的SlotNumber被赋值为和Disk4相同的pd.slot。

可能是下面这个流程异常:

是否是因为,在执行map_allowed时,手动对nvme8进行了点灯,导致映射关系建立错误

是的 点灯流程中,不能手动点其他盘的定位灯,会干扰定位流程,定位流程每次只会点一个盘的灯,并读取盘的定位灯状态来确定是否bmc侧的盘和带内raid卡的管理的盘是同一个,之所以重启bmc也未恢复是因为映射关系做了复位持久化,在os下电情况下,raid卡定位过的盘依然能显示在raid卡下

那请问出现问题后要如何恢复?

OS做了电源循环,也没有恢复

需要AC一下 BMC侧cli命令ipmcset -t maintenance -d accycle

请问什么时候BMC才会执行raid卡下硬盘定位流程?我看有一个定时任务update_pd_list,为什么在执行该任务的时候不会把之前异常识别到raid下的硬盘移除?

点灯时候会优先从持久化数据中拿(复位持久化), AC之后应该就没有这个持久化数据了,会重新定位。

回答的是这个问题么? 这个我是想问 update_pd_list任务为何不会把错误识别的硬盘从raid下移除。因为我看这个任务里是有更新pd_list的

是会一直更新pd_list,这个主要是用于插拔硬盘的校验,插拔了硬盘会重新定位,已定位过的映射不会再更新

这样错误识别过的硬盘就会一直错误显示在raid下面,整机AC对客户来说代价太大。
请问对这种情况后续有没有计划优化

一是要防止定位流程中,用户手动点灯干扰了定位

二是错误定位了后,除了AC 可以通过拔盘也可以取消映射

一是要防止定位流程中,用户手动点灯干扰了定位

二是错误定位了后,除了AC 可以通过拔盘