Atlas 300I A2 NPU卡读取问题

社区vpd仓代码以及硬盘、板卡兼容性说明.md文档里面已经提及到Atlas 300I A2 NPU已经适配;请问这个卡的温度、功耗、部件编码、序列号等这些都可以拿到吗?

答案内容由AI生成,仅供参考:

Atlas 300I A2 NPU卡信息读取能力分析

根据现有资料,关于Atlas 300I A2 NPU卡的温度、功耗、部件编码、序列号等信息的读取情况如下:

支持读取的信息

温度和功耗

  • 温度监控:支持通过bmc.kepler.Systems.Processor.NPU接口读取多种温度传感器数据,包括:

    • ChipTemperature(芯片温度)
    • AiCoreTemp(AI核心温度)
    • HBMTemp(HBM温度)
    • NimBusTemp(Nimbus总线温度)
    • VRDChipTemp(VRD芯片温度)
  • 功耗监控:支持通过std_smbus协议获取功耗数据(PowerWatts),获取周期为2秒。

部件编码和序列号

  • 部件编码(Part Number):支持读取,Atlas 300I A2的部件编号为02314RAL
  • 序列号(Serial Number):支持通过std_smbus协议获取,通常在BMC启动时获取电子标签信息。

实现方式

所有上述信息均通过华为自研的std_smbus带外管理协议获取,这是NPU卡信息采集的标准方式。

潜在问题

尽管在VPD仓代码和兼容性文档中已说明Atlas 300I A2已被适配,但在实际使用中可能存在一些不确定性:

  • 有报告指出在某些情况下NPU卡信息获取不稳定,多数情况获取不到。
  • 温度和功耗数据依赖于compute组件与smbus的正常交互,如果smbus通信存在问题,可能导致信息获取失败。

综上所述,从理论上和技术规格上,Atlas 300I A2 NPU卡的温度、功耗、部件编码和序列号都是可以获取的,但实际读取效果可能受系统配置和通信稳定性的影响。

现在是有哪些信息获取不到?

我们现在还没有测试这个卡,只是想提前了解一下,正常流程是否能够拿到这个卡的相关信息

均支持获取