查看FC卡信息,发现光模块信息显示不太对劲:
当前温度为负数,且告警阈值也不对劲。
busctl 查看以下资源:/bmc/kepler/Systems/1/Sms/1/ComputerSystem/Systems/1/Storage/1/FC/0000_3A16_3A00_2E0_5F0000_3A17_3A00_2E0/Sff/Diagnostic
ibma发送过来的数据就是这样,与OS下查询的信息不匹配:
请问这个信息的获取是不是存在异常?
查看FC卡信息,发现光模块信息显示不太对劲:
busctl 查看以下资源:/bmc/kepler/Systems/1/Sms/1/ComputerSystem/Systems/1/Storage/1/FC/0000_3A16_3A00_2E0_5F0000_3A17_3A00_2E0/Sff/Diagnostic
请问这个信息的获取是不是存在异常?
答案内容由AI生成,仅供参考:
根据您提供的信息,系统中 LPe32002-AP FC卡的光模块信息显示存在明显异常,特别是温度为负值、告警阈值逻辑混乱等问题。以下基于知识库中的实体、关系和文档内容,对问题进行系统性分析。
TempHighAlarmCelsius)为 0.31℃,低于当前“测量值”。TempLowAlarmCelsius)为 0.96℃,高于高温阈值。busctl 查询 /bmc/kepler/Systems/.../Sff/Diagnostic 接口,确认这些异常数据确由系统上报,并被 IBMA(带内管理代理)采集。IBMA服务作用:
IBMA Service 是负责管理 LPe32002-AP Fibre Channel 适配器的关键服务”。Issue 关联 FC Card LPe35002-AP 的描述)。IBMA数据路径:
“网口信息通过以下路径传递到 network_adapter:带内 → sms接口 → host_agent → network_adapter”
lpfc 驱动)并通过 IBMA 上报。关键知识图谱信息:
Emulex FC Card使用厂商专用工具hbacmd来提取EEPROM数据并进行协议解析。
潜在问题点:
hbacmd 工具,或该工具未正确解析 SFP+ 模块的 EEPROM 数据(特别是温度、电压、功率等模拟量),将导致:
busctl 输出验证数据异常从 busctl 输出可见:
.TempCurrentCelsius property v d -47.88
.TempHighAlarmCelsius property v d 0.31
...
.RxPowerLowAlarmMilliwatt property v d 5.27 ← 正常接收功率仅3.92,却低于“低告警”阈值
这表明:
| 现象 | 对应支持信息 |
|---|---|
| 光模块信息通过 IBMA 获取 | FC Information on LPe32002-AP depends on IBMA Service |
| Emulex FC卡需专用工具读取光模块 | Emulex FC Card → uses hbacmd tool |
| 温度/功率等字段在 D-Bus 中存在 | bmc.kepler.Systems.OpticalModule 定义了完整诊断属性 |
| 数据路径为:Host → IBMA → BMC | “带内BMA获取网卡信息”路径描述 |
是的,该信息的获取存在异常。
具体判断如下:
hbacmd 工具未正确执行 或 lpfc 驱动返回了错误的诊断数据。SFF-8472 格式时存在 Bug,导致字节解析错位。验证主机侧实际数据:
在服务器操作系统中执行:
hbacmd <controller> getSfpInfo
查看原生输出是否同样异常。若是,则问题出在驱动或工具链。
检查 hbacmd 和 lpfc 驱动版本兼容性:
14.2.673.400:14.2.0.7(注意格式不规范,可能为解析错误)启用带外协议作为对比(未来方向):
上报 Issue 至开发团队:
参考已有 Issue 模式(如 Kunlun Jiaoxinchao 报告的类似问题),提交完整的一键日志(One-Click Log)以供分析。
| 项目 | 判断 |
|---|---|
| 是否信息异常? | |
| 是否BMC展示问题? | |
| 是否IBMA数据问题? | |
| 是否Emulex卡特有? | hbacmd |
| 解决建议 | 执行 hbacmd getSfpInfo 验证源数据,检查驱动/工具版本 |
建议优先在主机端验证原始数据,确认问题层级后再进行修复。
相关链接:
方便附一下iBMA日志和配置信息,以及BMC的一键收集日志吗?
iBMA日志和配置信息收集方法如下:
cd /opt/huawei/ibma(/opt/huawei路径不存在的情况下,使用/opt/ibma) OS后台进入到iBMA目录下
tar -zcf ibma_log.tar.gz log/ config/
拿到 ibma_log.tar.gz 压缩包,即为iBMA日志及配置信息。
好的 麻烦提供一下邮箱
你好,请发送至 jiahuilei1@h-partners.com
由于大量社区举报,此话题被临时关闭至少 4 小时。
请麻烦再操作收集下更多日志以便定位,多谢~
1、执行 ibmacli debug -e true -m http 命令,开启BMA的debug日志后,过几分钟后,获取一下bma路径下最新的 log/http_server.log
2、获取下当前最新的BMC界面的FC卡光模块信息截图
3、查询一下 hbacmd GetXcvrData 10:00:00:10:9c:1d:6f:65 2 命令结果,即在原提问中查询的命令后面加个 2 ,获取原始数据
请问目前可以确认该问题是否需要iBMA来解决么
可否查询一下环境上的hbacmd工具的版本?目前看很有可能和这个工具回显有关系
判断为ibma和hbacmd版本兼容问题
后使用hbacmd 14.2.455.10版本,iBMA使用2.16、2.17、2.19版本均可正确显示hba卡光模块信息。