基于社区330发行版本
通过自发现加载了当前NPU卡,但是获取温度和功率失败,查看日志信息,打印如下:
我们有两款switch板,一款通过9545扩展I2C,一款通过iic forward,现在插在9545的switch上可以读取到温度功率,通过iic forward实现的读取失败。
BMC有提供tracechip的方法用于定位与硬件交互的数据信息
思路:
1、确认BMC侧发送的数据中地址、偏移等内容是否符合预期
2、确认是否收到的数据就是全F,如果是则需要硬件去定位
使用方法介绍:
登录ibmc环境,输入mdbctl命令进入在线调试终端
输入attach hwproxy链接hwproxy组件
根据要跟踪的chip对象名,如对Eeprom对象
tracechip trace Eeprom_1_1
即可跟踪该chip对象发送和接收的数据
取消tracechip跟踪能力可执行
tracechip untrace Eeprom_1_1
手动发送命令可通过新开一个窗口
busctl --user call bmc.kepler.hwproxy /bmc/kepler/Chip/Eeprom/Eeprom_1_1 bmc.kepler.Chip.BlockIO Read a{ss}uu 0 的方法
您好,如果在正常设备读到的数据符合您的预期,但异常设备上报全F的话,很可能是硬件问题,可能需要硬件那边排查一下。
请问这个问题解决了吗?我们也遇到了一样的问题,使用iic forward读到卡的数据全是F
解决了
已验证,此方案可解决问题:
在Chip对象中增加DrvWriteDelay属性,属性到位是毫秒,可以根据整机场景来灵活适配写完等待的时间。


