OYYG
(baixin_ouyangyonggang)
1
问题背景:
1、服务器两电源均正常工作,拔掉其中一个电源的电源线后,在web界面未产生任何电源相关告警。
2、服务器风扇工作正常,拔掉其中一个风扇,在web界面未产生任何风扇相关告警。
3、通过cli命令对电源模拟注入故障,电源状态传感器检测失败,但未产生任何电源相关告警。
4、收集日志查看已拔电源线的信息,在位,输入输出电压均为0。
求助点:
咨询PAE,拔电源线或风扇正常情况下应产生冗余告警和输出告警,但操作后未产生任何告警。暂不了解openUBMC上电源及风扇告警的触发机制,无法从代码层面了解未上报告警的原因,希望论坛伙伴或华为工程师能帮忙定位下原因或提供下定位思路。
初步分析思路:
1、查看编译临时目录,在event_def.json和ibmcevents.json都存在且有风扇移除事件的定义
2、查看一键日志alarm.log,发现所有事件对象注册时都未定义
3、目前表现出的现象不只是拔电源及风扇未触发告警,所有的系统事件都不会触发
1 个赞
wwhh
(Wwhh)
4
风扇告警:仅转速偏差告警和不同风扇类型混插告警,若需不在位告警,需自行新增;
请先确认是否有自行新增告警。
可查看/data/opt/bmc/conf/event_def.json和/opt/bmc/conf/event_def.json文件中事件定义内容是否为空
如果是这种就是有问题

在vpd打包时将event_def.json中版本号改大
2 个赞
看你的alarm.log,好像所有事件都没有定义,应该是事件都没有添加进来,参考社区的文档事件定制 | openUBMC
确认一下你的项目路径下有没有 /event/eventDefList.txt,没有的话copy过来。这个文件中的事件就是你期望启用的,组件到时候会根据这个文件中的事件从基础的event_def.json中筛选出来,生成需要的event_def.json。
之前我试过只留两个事件,最后/opt/bmc/conf/event_def.json里就只剩对应的这两个。
2 个赞
查看环境,/opt/bmc/conf/event_def.json有完整的告警内容,/data/opt/bmc/conf/event_def.json中为空,已将event_def.json版本号从1.0.0改为1.0.1
,
将/opt/bmc/conf/event_def.json拷贝到/data/opt/bmc/conf/下,重启BMC有系统事件生成,mock模拟告警事件可以正常产生。尝试将编译临时目录中生成的event_def.json放到/build/product/BMC/openUBMC/rootfs/data/opt/bmc/conf重新出包可临时解决该问题。
目前不太明白的是为什么/opt/bmc/conf/event_def.json有内容而/data/opt/bmc/conf/event_def.json事件定义为空?