服务器上电时,链接网线的NIC网口会出现多余的插拔事件

问题现象

服务器上电时,链接网线的NIC网口会出现多余的插拔事件

该问题非单台问题,必现,伙伴版本和华为商用版本均存在

问题分析

后台日志有日志相关打印:

事件定义:

customer/Huawei/TaiShanServer2.9.0_CSR/14220246_00000001100302023955.sr

customer/Huawei/TaiShanServer2.9.0_CSR/14220246_00000001100302023955_soft.sr

<=/NetworkAdapter_1.SlotNumber;<=/Scanner_Lom1Port1Link.Value;<=/Scanner_Lom2Port1Link.Value;<=/Scanner_Lom1Port1Link.Status;<=/Scanner_Lom2Port1Link.Status |> expr($1 == 1 ? ($4 == 0 ? $2 : 255) : ($5 == 0 ? $3 : 255))

即,Port1、Port2、Port3、Port4 的连接状态都来源于扩展板CPLD,只有Port1 出告警(因为只有Port1接线了)。

板卡信息为:

HDD Backplane Info
Name            | Position        | Manufacturer    | Slot            | Description                      | UID                              | SerialNum       | PartNum         | PCB Ver         | CPLDVersion     | HWSRVersion    
BC83NHBC        | SEU1            | Huawei          | 1               | 12*3.5 SAS/SATA(4*NVMe)          | 00000001030302023936             | D924C0373744    | 0302023936      | .A              | 3.04            | 3.12      
BC83NHBF        | SEU5            | Huawei          | 5               | 4*2.5 NVME(2*SAS/SATA)           | 00000001030302024340             | DU24C9101766    | 0302024340      | .A              | 3.11            | 2.06      
BC83HBBE        | SEU3Rear        | Huawei          | 3               | 2*2.5 SAS/SATA, Rear             | 00000001030302023930             |                 | 0302023930      | .A              | N/A             |           


FAN board Info
Name            | Position        | Manufacturer    | Slot            | Description                      | UID                              | SerialNum       | PartNum         | PCB Ver         | CPLDVersion     | HWSRVersion    
BC83FDCA        | CLU1            | Huawei          | 1               | FanBoard                         | 00000001050302023924             |                 | 0302023924      | .A              | 2.10            | 3.10      


Riser Card Info
Name            | Position        | Manufacturer    | Slot            | Description                      | UID                              | SerialNum       | PartNum         | PCB Ver         | CPLDVersion     | HWSRVersion    
BC83PRUO        | chassis         | Huawei          | 2               | Riser(X16*1+X8*2)                | 00000001040302044498             |                 | 0302044498      | .A              | N/A             | 3.06      
BC83PRUDA       | chassis         | Huawei          | 1               | Riser(X16*1)                     | 00000001040302025554             |                 | 0302025554      | .C              | N/A             | 3.04      


EXP board info
Name            | Position        | Manufacturer    | Slot            | Description                      | UID                              | SerialNum       | PartNum         | PCB Ver         | CPLDVersion     | HWSRVersion    
BC83SMMBC       | EXU1            | Huawei          | 1               | Expander Board                   | 00000001010302044492             |                 | 0302044492      | .A              | 4.10            | 3.24      


CPU board Info
Name            | Position        | Manufacturer    | Slot            | Description                      | UID                              | SerialNum       | PartNum         | PCB Ver         | CPLDVersion     | HWSRVersion    
BC83AMDAA01     | BCU1            | Huawei          | 1               | CpuBoard                         | 00000001020302031825             |                 | 5104-00800      | .B              | 6.12            | 3.29      

诉求

1、该问题是否是问题?是BMC还是CPLD的问题?在华为侧是否有问题单跟踪?解决方法什么时候会同步到社区版本?

若需要一键日志请留下大侠邮箱。

你好,当前环境还有这个问题吗?该告警已经做了防抖和异常处理,可以确定是上报的真实值,需要cpld确定是否有硬件异常

一直都有

可以看到配置的scanner是配置了防抖的,并且在读值的表达式中也对scanner的异常值做了判断,确定这个告警是真实上报的。建议把网线接到第二个口,观察第二个口会不会报这个事件。如果不报,说明第一个口的链接状态cpld上报有异常