wangdong
(Wangdong)
1
// 此模板仅供参考,如果不适用可以修改
问题描述
AC测试偶现9560-16i Raid卡偶现高温告警,出现高温告警时,BBU温度传感器读值都是254。
环境信息
-
操作系统:[如 Ubuntu 24.04]
-
软件版本:[如 OpenUBMC2509]
-
硬件配置:[如 CPU、内存等]
重现步骤
-
[第一步]
-
[第二步]
-
[第三步]
期望结果
查看代码BBU温度直接通过raid卡获取。想知道读出254可能的原因,能否直接在CSR里更改表达式将expr(($1 < 255) ? $1 : 0)改为<254
实际结果
AC压测不出现BBU温度高温告警
尝试过的解决方案
[列出您已经尝试过的解决方案及结果]
wangdong
(Wangdong)
4
BBU温度看代码是从raid卡获取的,bmc这看不出具体原因。配置具体指的哪些
发下你vpd和storage的版本号 我看下这张raid卡的csr和 storage的业务代码逻辑
wangdong
(Wangdong)
6
vpd:1.81.7 storage:1.81.0
没看出254是哪来的,建议发下一键日志收集
也可以参考下如下修改试试
"Event_BBUOverTemp": {
"Reading": "<=/Battery_1.TemperatureCelsius |> expr(($1 < 255) ? $1 : 0)",
"OperatorId": 4,
"Condition": "<=/ThresholdSensor_PCIeBBUTemp.UpperNoncritical",
"@Default": {
// 添加Reading的默认值
"Reading": 20
"Condition": 60
},
"Enabled": true,
"DescArg1": "#/PCIeDevice_1.SlotID",
"DescArg2": "#/Battery_1.TemperatureCelsius",
"DescArg3": "#/ThresholdSensor_PCIeBBUTemp.UpperNoncritical",
"LedFaultCode": "b02",
"Component": "#/Component_Battery",
"Hysteresis": 2
},