【event】测试在跑AC长稳测试时,发现事件不显示

环境在跑AC之前有很多告警,AC不会消除,但是在第18次AC时,发现全部告警都消失了

查看日志,最后一次AC有以下打印:

2025-12-24 01:11:34.741357 unknown_service ERROR: main.lua(121): load event def file, and will use empty config, because ./opt/bmc/apps/event/lualib/event_common.lua:1003: decode: json object decode failed:
2025-12-24 01:11:34.742240 unknown_service NOTICE: main.lua(133): init event defs end

这个是不是加载event_def.json文件失败了?我在故障环境上看了这个文件,是完好的,最后没定位到根因,重启之后就好了?为啥会失败呢

参考下这个帖子的排查方案:ACcycle测试过程中,出现事件注册失效,WEB界面告警消失

一样的原因,但是这种概率性问题,是不是只有等社区解决了 :sweat_smile:

decode json文件失败了?奇怪,为啥会出现这种情况呢

你这个截图不是一回事吧

其他对象都能注册 说明加载了的 只是对应的告警没有找到配置

最上面的截图 其实就是执行json.decode

这个只出了一次吗

其次也发下event版本

这个是最后一次AC的时候出现的,前面没出现过这个日志,在凌晨1点出问题,脚本就停了,等我看的时候还没恢复


这个是最后一次AC的时候截图

event版本是这个:

复位就恢复了?不是升级?

这里是构建产生的文件decode失败了

要看/opt/bmc/conf/event_def.json 这个文件

我问了下测试,后续环境是升级了,然后恢复了,你得意思是这个文件被破坏了?也没人动他呀,奇怪

跑的好好的为啥会失败呢 :rofl:

有点没理解

这个只能出现的时候看一下上面那个文件了

如果内容是合法的

那只能怀疑file:read 和 json.decode 这俩函数有什么问题了

如果是的话 可以发我一份 测试一下