背景
硬盘点灯前无法区分硬盘是CPU直通还是raid纳管,点灯失败后不会告警(link abnormal)。解决方案是硬件提供高速线缆检测信号判断背板上的盘是直通管理还是raid管理,storage组件获取硬盘槽位是否是直通解法,结合硬盘在位判断。如果是非直通的盘且点灯失败,就产生link abnormal告警。
graph TD;
subgraph bp[硬盘背板]
a[槽位1]
b[槽位2]
end
a-->raid[raid卡];
b<--UBC高速线缆-->bcu[基础板];
关联ISSUE
(可选)此议题关联的代码仓的issue链接。(提交议题时删除此引导说明)
整体方案
sequenceDiagram
pcie_device ->> +BCU: 读取高速线缆信息
BCU-->>-pcie_device: 返回当前高速线缆接法
pcie_device ->> pcie_device: 判断硬盘槽位是否是直通接法,更新PCIeAddrInfo属性
storage->>+pcie_device: 遍历PCIeAddrInfo对象属性,或调用rpc方法
pcie_device ->> -storage: 获取是否直通盘信息
storage ->> storage: 判断非直通的盘且点灯失败,就产生告警
评审点
变更资源协作接口 bmc.kepler.Systems.PcieAddrInfo
详细描述
(必选)详细描述接口设计,多种备选设计时需要以表格的方式对比优缺点,包括但不限于可扩展性、可裁剪性、可维护性、性能等维度, 具体格式参考下面的场景。(提交议题时删除此引导说明)
变更描述:接口承载了PCIe槽位相关的功能,新增属性同属于PCIe槽位信息功能的一部分。
接口链接:bmc.kepler.Systems.PcieAddrInfo接口定义。
| 变更类型 | 属性名称 | 签名 | 只读 | 变化通知 | 属性描述 | | | 访问权限 | 属性来源 | 持久化类型 | 变更影响 |
|---|---|---|---|---|---|---|---|---|---|---|
新增 |
HBAMode |
y |
True |
True |
属性描述,表示PCIe槽位是否直通CPU,默认值为255 |
Read: ReadOnly |
不持久化 |
无影响 |
接口变更影响
| 路径 | 接口变更影响 | | | CSR配置影响 | 持久化影响 | 其他影响 |
|---|---|---|---|---|---|
/bmc/kepler/Systems/:SystemId/PCIeDevices/PcieAddrInfo/:ID |
新增HBAMode属性,提供展示是否直通CPU功能 |
不涉及重名属性,无影响 |
不涉及新增和废弃主键,无兼容性问题 |
需实现新增属性 |
评审结论
(必选)针对决策点,详细描述最终结论,不能是简单的同意或不同意,通过或不通过。(提交议题时删除此引导说明)
同意/bmc/kepler/Systems/:SystemId/PCIeDevices/PcieAddrInfo/:ID`接口新增/redfish/v1/XXXXX的GET操作响应体增加如下属性
| 变更类型 | 属性名称 | 签名 | 只读 | 变化通知 | 属性描述 | | | 访问权限 | 属性来源 | 持久化类型 | 变更影响 |
|---|---|---|---|---|---|---|---|---|---|---|
新增 |
HBAMode |
y |
True |
True |
属性描述,表示PCIe槽位是否直通CPU,默认值为255 |
Read: ReadOnly |
不持久化 |
无影响 |
遗留问题
(可选)列出评审会议现场无法直接给出明确结论的事务,会后确认清楚之后要在此处录入明确的结论,如不涉及,则可以写无或删除此部分。参考格式如下:(提交议题时删除此引导说明)
1、需要确认XXX
结论: