HLLC CPU 互联通道 CE 故障,当前提供资源树属性与告警能力吗

问题描述

带内注入 HLLC_CE 故障,BMC 侧 fdm_log 有告警,但预期要产生 SEL 日志,需要提供资源树属性,当前该故障有提供对应的资源树属性吗?请帮忙确认谢谢

HLLC+CE+BMC无告警.tar.gz (7.9 MB)

环境信息

社区 330 基线

答案内容由AI生成,仅供参考:
根据提供的知识库信息,当前没有明确提及支持HLLC CPU互联通道CE故障的专用资源树属性和告警能力。但存在与CPU CE故障相关的通用能力,可参考如下:


1. 与CPU CE故障相关的通用属性

在已评审的资源协作接口中,新增了支持CPU CE故障发生频率超限的原子能力,具体属性如下:

  • 资源路径/bmc/kepler/Systems/:SystemId/FDMDomain/CPURAS/:Id
  • 资源接口bmc.kepler.Systems.FDMDomain.CPURAS
  • 新增属性CorrectableErrorOverfrequencyCount
    • 签名u(无符号整数)
    • 说明:系统运行周期内,CPU CE故障发生频率超限的次数
    • 持久化:复位持久化
    • 操作权限:ReadOnly

该属性可用于记录CPU CE故障频率超限事件,并可根据配置触发SEL日志记录。


2. 对HLLC CE故障的现有支持分析

  • 上下文中的“HLLC”并未作为独立实体出现在知识图谱或文档片段中。
  • HCCS Event(高速链路监控事件)和CPU UCE FaultCPU CE故障等概念是已知的,但未明确将HLLC CE故障归类于上述任何一项。
  • 在问题单和需求列表中,存在“支持CPU CE故障发生频率超限原子能力”的需求,但未专门提及HLLC互联通道。

因此,当前提供的上下文信息不足以确认HLLC CPU互联通道CE故障已被单独支持。该故障可能属于通用CPU CE故障范畴,但需要进一步确认其是否与CorrectableErrorOverfrequencyCount等属性关联。


3. 建议

  1. 确认HLLC CE故障是否可映射为通用CPU CE故障:如果HLLC CE故障属于CPU可纠正错误(CE)的一种,则可复用上述资源树属性,并检查BMC的RAS配置是否支持记录SEL。
  2. 检查当前BMC的fdm_log告警与SEL生成逻辑:若fdm_log已有告警但未产生SEL,可能需要检查对应故障的SEL使能开关或事件配置(如CorrectableErrorOverfrequencyCount计数是否触发阈值)。
  3. 参考社区已关闭的相关需求:如“【需求】支持CPU CE故障发生频率超限原子能力”已于特定版本实现,可确认基线是否包含该特性。

注:以上结论严格基于提供的上下文信息,未推断外部知识。如需更精确支持情况,建议查阅对应版本的BMC资源树接口文档或社区issue。