【BMC版本】5.05.12.21
【问题现象】 S920X20机器,下电后在WEB固件升级界面点击重启BMC,风扇一直满转,直到按电源键开机后才正常。
【日志】
operation.log日志信息如下:
cooling_control.log日志信息如下:
从日志来看,在下电后重启BMC之前有出现DevID为0xffff的异常情况,请问该如何进一步定位该问题,谢谢!
【BMC版本】5.05.12.21
【问题现象】 S920X20机器,下电后在WEB固件升级界面点击重启BMC,风扇一直满转,直到按电源键开机后才正常。
【日志】
operation.log日志信息如下:
从日志来看,在下电后重启BMC之前有出现DevID为0xffff的异常情况,请问该如何进一步定位该问题,谢谢!
提供相关日志
fan.doc (105 KB)
社区无法直接上传压缩格式的文件,我将部分日志文件放入doc了,帮忙看一下是否还有需要补充的。
从app.log日志中确认,当前还处于BMC启动阶段,启动阶段时下发固定风扇转速100,需要在BMC启动完成后(风扇加载完成),才会按照相应调速策略进行调速
我们等待了一段时间,等BMC启动完成后,查看风扇依然是满转的。
收集的日志fan_info.txt中风扇也是满转的。
调速组件启动过程初始化阶段会对所有风扇下发一个满转(默认值100,可以出厂定制或ipmi修改 ),之后自动调速接管,这时候你的环境么有生效的目标调速,所以算不出来新的转速。
没有目标调速生效的时候,调速日志reqid显示 就是0xffff
需要排查调速策略了,预期下电 至少 是有一条目标调速生效。否则DC下电重启bmc,那么必然满转
下电状态下风扇应该是不转的,这个是通过调速策略的配置控制的,还是业务代码直接控制的?
因为是现网出现的问题(多台机器都出现),我们在家里用同样的版本和步骤暂未复现问题,从收集的日志能进一步定位吗?
下后电后风扇在以下几种场景下会转的,Ncsi线缆在位,插入了OCP卡(还有什么其他的场景需要问hw专家,或者你们硬件做了新供电场景适配)这是通过风扇板cpld代码控制是否对风扇板供电的。
让硬件看当前风扇板的cpld代码,看供电逻辑,再排查服务器配置看为什么供电了
已经确定没有接ocp卡、也没有接NCSI线缆,完整的日志已经发邮箱,请帮忙进一步分析,谢谢!