本篇我们来聊聊作为故障预测与健康管理PHM 核心支持技术—故障预测的方法论。
一、基于故障标尺的方法
基于故障标尺的故障预测方法,也叫预兆单元法。该方法是指根据实际被监测产品的故障机理及模型,以相同的制造工艺和过程特制出相同的产品,假设待监测的产品同该特制产品具有相同的性能和状态,而且它们工作于相同的环境条件下,因此,该特制产品可以表征待监测产品的健康状态。实际上由于该特制产品按已知比例缩短的寿命先于待监测产品失效,因而具有保险丝的作用。如果按不同的加速比例制造出一系列这样的产品,就像在电子产品内部设置了“故障标尺”,从而可以预测产品的剩余寿命。
国外研究者将预兆单元形象地称为“金丝雀(Canaries)”。金丝雀对矿井中的危险气体非常敏感,高危气体浓度过高会使它在发生事故前表现出病态甚至死亡,所以早期将它用于矿井高危气体的报警。同理,设计预兆单元与主器件、电路、系统集成在一起,使其按一定的机理在主电路或系统失效前提前失效,就可为宿主电路与系统的失效提供预警。在实际使用中,预兆单元作为宿主电路的子模块,见证宿主电路从生产到测试再到使用所经历的全寿命环境。预兆单元的寿命需要根据主电路失效机理进行预校准。影响器件可靠性的因素有电压、电流、温度、湿度、辐射等,如果承受相同的应力,主副电路的失效率应该是相同的。如果按一定的比例改变预兆单元承受的应力条件,则预兆单元电路会先于宿主电路失效。应力缩放可以通过改变预兆单元内部的电流密度来实现。通过相同的电荷量,如果预兆单元载流部分的横截面较小,则可以获得较大的电流密度。与此类似,也可以通过改变预兆单元中的电压来实现大电流密度。大电流密度会导致内部发热量增大,应力增大,最终使预兆单元的失效率增大。由此,可以按不同的加速比例设置多个预兆单元模块,即在浴盆曲线上设置多个报警点,得到紧急程度不同的失效报警。
在这方面,美国锐拓公司已经开发了一系列可用于PHM的预兆单元。
二、基于失效物理(PoF)的方法
基于失效物理(PoF)的方法是指在已知电子产品物理失效模型的基础上,利用产品的生命周期载荷和失效机理知识来评估产品的可靠性。它也可以通过监测产品的使用环境条件,如温度、振动等参数信息,进而根据损伤累积模型预测产品的剩余寿命,即在系统的实际应用条件下评估和预测其可靠性。在这方面,美国马里兰大学CALCE中心进行了大量研究工作,该中心提出的基于PoF的PHM的方法也叫寿命损耗监测法,如下图所示。
寿命损耗监测法是指利用环境应力参数和工作应力参数,建立应力-损伤模型,计算累计损伤而预报失效。寿命损耗监测的基本概念是认为产品的性能退化或物理损伤是作用于产品的全寿命负载导致的。产品的退化程度和退化速率决定于负载的大小和使用速率、频率、剧烈度等。若可以在线测得负载状况,基于失效物理模型可计算产品受负载影响下的退化。外部环境应力会对电子元器件造成损伤,降低其可靠性,是引发电子设备故障的重要原因。应力损伤评估就是搜集和累积电子产品寿命周期内承受的全部外部应力载荷,计算累积损伤和寿命损耗,进行剩余寿命估计。为此,需要在产品内嵌入若干个传感器来感知外部载荷,如温度、温度变化、湿度、振动、冲击、压力、电压、电流等。
三、基于故障状态信息的方法
基于故障状态信息的方法是直接采信产品的功能及性能信息进行故障诊断,在BIT的基础上,采集电性能退化信息,可以实现电子产品的故障预测。
四、基于失效先兆监控法
基于失效先兆监控法是指根据一些失效先兆信息,如性能参数漂移,对其进行监控推理,最终预报失效。失效先兆指失效症状出现前的异常信号,通常是失效发生前可测的变化。通过建立被测信号变化与随后发生的失效之间的因果关系就可以用于建立推理算法,预测故障。基于失效先兆监控法也叫基于异常特征监测法。
基于故障先兆推理的PHM系统在确定需要被监控的故障先兆参数后,需要建立故障先兆参数与随后发生的故障之间的推理算法。故障先兆参数在预定条件或加速条件下测试,由实验结果得到的模型可以是参数拟合曲线、神经系统网络、贝叶斯网络或故障先兆信号的时间序列。该方法假设被测器件处于一种或几种确定的使用条件下,可以在实验条件中模拟。然而,很多器件的实际工作环境条件却无法进行仿真模拟。例如,对于野外工作的设备,所处的环境复杂多变,一旦工作条件发生预期外的突变,得到的故障先兆信号也会发生变化,如果建立的模型没有全面考虑设备的全寿命工作条件和所处环境条件,则可能发出错误预警。除此之外,通常也不可能找到涵盖所有方面的先兆模型,所以,故障先兆特征和模型建立可能耗损大量人力物力而得不到预期的效果。
五、基于数据驱动的方法
基于数据驱动方法指基于可用的历史信息,如以系统处于“健康”时的数据作为训练数据,以实际使用过程中实时采集到的数据作为测试数据,利用各种统计方法和机器学习的方法对这些数据进行处理和分析,检查测试数据的特征与训练数据的特征之间的退化或差异情况,从而实现对系统健康状况评估、故障诊断及寿命预测。
这种方法基于一种假设:系统参数的统计特征只有当故障产生时才发生变化,从而可以通过对参数(如环境应力、工作负载及能够反映电子器件或产品性能的参数,如电流、电压、电阻等)的在线监测与分析来发现异常,确定退化趋势,判断系统的健康状态,同时该退化趋势也可预测剩余寿命。