【已评审】支持内存超级风暴故障精准诊断

ISSUE链接:GitCode - 全球开发者的开源社区,开源代码托管平台
背景: 增强故障诊断检测能力,支持内存超级风暴故障精准诊断,满足超级风暴时更新对应事件状态属性、超级风暴生成次数属性
决策点: 故障识别设置资源树对应的属性
评审点1:
资源path:/bmc/kepler/Systems/:SystemId/MemoryChannel/:ID
资源interface:bmc.kepler.Systems.MemoryChannel
变化类型:[新增] [属性]
应用场景:超级CE风暴事件发生标志,事件发生时属性置1
持久化类型: BMC复位持久化
操作权限: ReadOnly
评审点2:
资源path:/bmc/kepler/Systems/:SystemId/FDMDomain/MemoryRAS/:Id
资源interface:bmc.kepler.Systems.FDMDomain.MemoryRAS
变化类型:[新增] [属性]
应用场景:超级CE风暴事件发生次数
持久化类型: BMC复位持久化
操作权限: ReadOnly
详细描述:

service OBJECT(path) interface method/property/signal type 权限 属性 是否广播 是否持久化 属性值来源 签名 取值类型 备注
bmc.kepler.compute /bmc/kepler/Systems/:SystemId/MemoryChannel/:ID bmc.kepler.Systems.MemoryChannel CorrectableECCStormBurstEvent property ReadOnly ro 复位 代码 y u8 内存发生超级CE风暴,取值:0-未发生,默认值;1-发生。系统下电/复位时,恢复到未发生状态。
bmc.kepler.fault_diagnosis /bmc/kepler/Systems/:SystemId/FDMDomain/MemoryRAS/:Id bmc.kepler.Systems.FDMDomain.MemoryRAS 4. CorrectableECCStormBurstCount property ReadOnly ro 复位 代码 u u32 统计内存发生超级CE风暴的次数, 取值范围:0~0xFFFFFFFF。系统下电/复位时,统计次数清零。

评审结论

  1. 同意新增属性标志超级CE风暴事件发生状态,具体如下:
    资源path:/bmc/kepler/Systems/:SystemId/MemoryChannel/:ID
    资源interface:bmc.kepler.Systems.MemoryChannel
    资源属性:CorrectableECCStormBurstEvent
    持久化类型: BMC复位持久化
    操作权限: ReadOnly
  2. 同意新增属性表示超级CE风暴事件发生次数,具体如下:
    资源path:/bmc/kepler/Systems/:SystemId/FDMDomain/MemoryRAS/:Id
    资源interface:bmc.kepler.Systems.FDMDomain.MemoryRAS
    资源属性:CorrectableECCStormBurstCount
    持久化类型: BMC复位持久化
    操作权限: ReadOnly

遗留事项

  1. 明确属性恢复默认值的场景
    结论:恢复场景为系统下电/复位时,恢复默认值。已在详细描述中刷新。
  2. 属性命名增加CE修饰
    结论:属性命名均已添加前缀CorrectableECC。已在详细描述中刷新。
1 个赞