无法获取raid卡信息,报错1104,控制器初始化未完成

现象如图:

日志报错发现:

社区搜索关键词发现有人说过这个报错是控制器初始化未完成的意思

目前已试过的规避方式:

1.更新驱动

2.更换固件

均无效,仍旧无法显示卡信息

这是什么原因呢?

组件信息:storage/1.80.117+patch.8@openubmc/stable

这个可能需要找raid卡的开发分析了

bmc的日志看不出线索么,或者还有什么定位方向呢?raid卡的开发是指提供卡的厂商么

这个错误码是第三方库,也就是raid卡返回的,只知道是初始化未完成的错误。具体初始化未完成的原因bmc感知不到

这个是我们这边的2U1P BS机器,raid卡是从好的机器上拆过来的,这个有什么解决办法吗,要给客户发样机

是不是没开启OOB

这个卡在其他环境是正常的吗,就只有这一台初始化不了?

在其他环境是正常的

是的 换过好的卡

怎么开

raid卡是从好的机器上拆过来插到2U1P BS 的 机器上的,在BS机器上就无法获取信息

storcli64 /c0 show oob 看下是否开启oob

这个是不是没有开的意思?我搜了下这个命令正常会输出IP

在LSI RAID卡的storcli64工具中,storcli64 /c0 show oob 命令用于显示Out-of-Band(带外)管理接口的相关信息。带外管理允许通过独立的网络接口(如IPMI或专用管理端口)远程监控和配置RAID卡,即使主机操作系统未启动也能操作。‌1

该命令的具体输出通常包括带外接口的IP地址、子网掩码、网关、MAC地址以及连接状态等网络配置详情。这些信息对于远程管理RAID卡、排查网络问题或配置远程访问至关重要。‌1

如果命令执行后无输出或提示错误,可能原因包括:

  • RAID卡不支持带外管理功能。
  • 带外接口未启用或网络配置缺失。
  • 用户权限不足,无法访问带外信息。‌

你在bios下面进入到raid卡的界面,看看这个raid 卡能正常访问不??感觉是卡有问题。

不会是卡有问题,因为试过了卡插到其他环境是正常的

还有一种方法可以定位,使用telnet连接,执行mount -o remount rw /,在/opt/bmc/conf/raid/raidlib_conf.ini文件里面,修改DEBUGLEVEL2MASK=0,然后修改下面的size大一些,修改一下/dev/shm这个路径到/tmp,然后保存,退出后重启os,会重新加载raid卡,可以在/tmp目录下生成raid_controller_lib.log,这里面有bmc和raid卡通信时的命令和日志,直到i2c的发送包和接收包都可以看到,可以进行分析

想问一下/opt/bmc/conf/raid/raidlib_conf.ini的配置是不是仅对博通有效,在开源的SML库中找不到对应的代码

是只针对博通有效,目前是不开源的,如果之前做过博通的卡的项目,可以找到代码,那部分代码基本没人修改

通过mdbctl call Chip_RaidChipXXX bmc.kepler.Chip.BlockIO Read 0 0(offset) 6(len)后,命令报超时,怀疑是链路问题,排查Chip_RaidChip对象的Address是否与厂商资料一致。