板卡的环温调速配置

网卡的环温调速要如何配置?目前只看见如下代码所示的,新增了一个CoolingArea关联了网卡的目标调速。只要ID确认,目标调速是可以根据槽位号区分开,从而保证不冲突。

"CoolingRequirement_1_2": {
      "RequirementId": 2,
      "Description": "进风口调速",
      "MonitoringStatus": "<=/ThresholdSensor_PCIeInletTemp.Reading |> expr($1 >= 200 ? 1 : 0)",
      "MonitoringValue": "<=/ThresholdSensor_PCIeInletTemp.Reading",
      "FailedValue": 80,
      "TargetTemperatureCelsius": 60,
      "MaxAllowedTemperatureCelsius": 65
    },
    "CoolingArea_1_2": {
      "AreaId": 2,
      "RequirementIdx": 2,
      "PolicyIdxGroup": [],
      "FanIdxGroup": [
        1,
        2,
        3,
        4
      ]
    },

但是环温的PolicyIdx没有这个机制,似乎是全局唯一的,也不做偏移和根据槽位号区分。目前代码仓上已有的若干CoolingPolicy_PCIE,都不满足我们热设计的要求。我要如何新增一个环温,保证环温的ID不与已有的重复呢?

14100513_00000001040302023953.sr
    "CoolingPolicy_PCIE_A_2": {
      "PolicyIdx": 29,
      "ActualCondVal": "<=/CoolingConfig_1.SmartCoolingMode",
      "Hysteresis": 1,
      "TemperatureRangeLow": [
        -127,
        25,
        30,
        35,
        40
      ],
      "TemperatureRangeHigh": [
        25,
        30,
        35,
        40,
        127
      ],
      "SpeedRangeLow": [
        35,
        35,
        50,
        70,
        100
      ],
      "SpeedRangeHigh": [
        35,
        35,
        50,
        70,
        100
      ],
      "FanType": [
        "02314EWC 8080+"
      ],
      "HDDBackPlaneName": [
        "BC83HBBA",
        "BC83NHBN",
        "BC83NHBC",
        "BC83NHBB",
        "BC83HBBH"
      ],
      "PCIeCardName": [
        "SP333",
        "LPE31002-AP",
        "SF200T",
        "Radeon Pro W6800",
        "SF400HT-A"
      ]
    },

若不能获取网卡温度值,则按照进风口曲线调速配置,配置方法如下:

  1. 配置CoolingRequirement;(CoolingRequirement_1_6为进风口调速策略)
  2. 配置CoolingPolicy调速曲线,可参考CoolingPolicy_PCIE_A_1;
  3. 配置CoolingArea,将配置的CoolingPolicy中的PolicyIdx添加至PolicyIdxGroup中
  1. 不能获取网卡温度值时,需要配置环温,没法配置CoolingRequirement吧;
  2. 目前的问题就是配置网卡的CoolingPolicy,无法保证PolicyIdx不与已有的重复,因为代码没有做这个事情,而其他渠道如何维护的不太清楚;

沟通结论:
CoolingPolicy需要统一配置在PSR内,通过PCIeCardName等属性关联生效条件,不单独配置在板卡内部,可以避免多个文件内配置的冲突。
在同一个文件内部配置方便区分PolicyIdx是否重复,按需分配。后续会补充门禁以及拦截手段进行查重处理。

2 个赞

不能获取网卡温度的;在主板有一个环温调速,可以把网卡名放在那里;v2也有类似实现