LCC
(Hkzy_licuncai)
1
环境在跑AC之前有很多告警,AC不会消除,但是在第18次AC时,发现全部告警都消失了
查看日志,最后一次AC有以下打印:
2025-12-24 01:11:34.741357 unknown_service ERROR: main.lua(121): load event def file, and will use empty config, because ./opt/bmc/apps/event/lualib/event_common.lua:1003: decode: json object decode failed:
2025-12-24 01:11:34.742240 unknown_service NOTICE: main.lua(133): init event defs end
这个是不是加载event_def.json文件失败了?我在故障环境上看了这个文件,是完好的,最后没定位到根因,重启之后就好了?为啥会失败呢
LCC
(Hkzy_licuncai)
3
一样的原因,但是这种概率性问题,是不是只有等社区解决了 
decode json文件失败了?奇怪,为啥会出现这种情况呢
你这个截图不是一回事吧
其他对象都能注册 说明加载了的 只是对应的告警没有找到配置
最上面的截图 其实就是执行json.decode
这个只出了一次吗
其次也发下event版本
LCC
(Hkzy_licuncai)
5
这个是最后一次AC的时候出现的,前面没出现过这个日志,在凌晨1点出问题,脚本就停了,等我看的时候还没恢复
这里是构建产生的文件decode失败了
要看/opt/bmc/conf/event_def.json 这个文件
LCC
(Hkzy_licuncai)
10
我问了下测试,后续环境是升级了,然后恢复了,你得意思是这个文件被破坏了?也没人动他呀,奇怪
这个只能出现的时候看一下上面那个文件了
如果内容是合法的
那只能怀疑file:read 和 json.decode 这俩函数有什么问题了
如果是的话 可以发我一份 测试一下