1 前言
RCM 是“以可靠性为中心的维修”的英文简称,其全文是“Reliability Centered Maintenance”。国军标GJB1378-1992《装备预防性维修大纲的制定要求与方法》对RCM的定义为:按照以最少的资源消耗保持装备固有可靠性和安全性的原则,应用逻辑决断的方法确定装备预防性维修要求的过程或方法[1]。它是目前国际上流行的、用以确定装备预防性维修工作、优化维修制度的一种系统工程方法,也是发达国家军队及工业部门制定军用装备和装备预防性维修大纲的首选方法。RCM理论和技术经过40多年的发展和应用,经过不断的改进,先后也有一系例不同的名称简写对应:RAM,RMA,R&M,MTA,MSG-3,RCMⅠ,RCMⅡ,然而每一次改进都是根据当时的先进维修技术和维修观念对装备故障模式和预防性维修工作类型的影响,来改善RCM的逻辑决断流程进而确定出针对不同故障模式的最有效的维修工作类型。从60年代末RCMA首先用于制定波音747飞机维修大纲的MSG-1 到2004年的MSG-3Ver2004的出版;从1985年2月美空军颁布的MIL-STD-1843到1999年的SAEJA1011;从1978年诺兰和希普的《以可靠性为中心的维修(RCM)》报告到1997年英国Aladon维修咨询有限公司的创始人John Moubray《RCMⅡ》第二版出版发行,无一不是体现现代维修技术对RCMA的影响。本文通过对近年来成熟的和新出现的维修技术对RCMA的影响分析,指出了RCMA技术的未来发展趋势。
2 RCM基本原理
2.1 历史起源
在20世纪50年代可靠性研究的主流方向是大型复杂装备的可靠性问题,尤其是到了1960年,为了解决维修费用增长过快、装备可用度差以及对基于时间的预防性维修有效性等问题,联邦航空管理局/航空工业可靠性大纲研究会(FAA/AIRPS)开始从事这方面的研究工作,即如何改进传统的维修大纲制定方法。传统的方法是基于复杂装备上的每个部件都有一个明显的工作寿命,并且经过彻底的检修能够保证系统运作的安全和可靠。而实际上人们发现许多模式的失效并不能根据所谓“准确工作寿命”确定的彻底检修进行修复,而且无论其力度有多大、作业有多完善都无法来预防或有效的减少这些失效的发生。研究结果发现:对于复杂系统,除非其部件只有一个关键的失效模式,否则预防性维修对系统可靠性影响甚微;在复杂系统中,存在大量的单元,找不到适合的、有效的预防维修方式[2]。也就是说第一代(二战前)和第二代(二战后)故障曲线不再能够有效的描述装备失效模式,通过研究发展出了第三代故障曲线。它的出现直接推动了RCMA技术的形成。
2.2 理论框架
RCM作为一种基本方法论,在权衡满足装备固有可靠性要求所需的维修及其资源时,是基于一下四个方面的理论基础[3]:
1、装备固有可靠性和安全性是由设计制造所赋予的特性,有效的维修只能保持而不能提高它们;
2、装备上部件(项目)故障具有不同的影响和后果,应采取不同的对策;
3、装备的故障规律不同,应采取不同方式控制维修工作时机和类型;
4、不同的预防性维修工作类型,其消耗资源、费用、难度和深度是不同的,可以加以排序,如按费用的多少及保守程度,可将维修工作分为:①保养;②使用人员监控;③使用检查;④潜在故障检测;⑤定期修复;⑥定期报废;⑦综合工作。
由上述分析可知RCM作为一种确定预防性维修工作的方法,它要求首先确定装备基本的运行状态、正常运转标准和加速耗损问题以及各组成部件的故障规律和故障模式,然后运用逻辑决断模型来确定维修任务和维修检测间隔,否则就不能很好的采用该方法。因此RCM过程中有两个关键工具:一是FMECA(故障模式、影响和危害度分析);另一个是逻辑决断图,它在航空工业中被称为MSG-3(维修指导小组模型―3)。FMECA则要求明确所有可维修的重要项目的功能、功能故障模式、故障影响和故障原因,而逻辑决断图通常用于选择那些技术可行且经济合理的维修策略。
2.3 RCM分析的一般步骤
一般情况下,RCMA可分为三部分[1]:①系统和设备的RCM分析;②结构项目的RCM;③区域检查分析。不同部分的RCMA过程不同,本文仅以系统和设备的RCM分析为例介绍其一般步骤[1]:
①确定重要项目(SI)通过
②对重要项目进行FMEA
③进行RCM逻辑决断
④确定预防性维修工作的间隔期
⑤进行预防性维修工作的组合
2.4 RCM特点分析
就RCMA的过程本身而言,它只是一种基于FMEA和逻辑决断图的优化方法,它的着眼点是针对不同的故障模式选择何种维修最为有效,只要维修和故障之间的这种本构关系不变,RCM的主体框架即逻辑决断图的整体构架就不会有变化。然而RCM作为一种确定装备预防性维修工作、优化维修制度的一种系统工程方法,其本质涵义是以最少的资源消耗保持装备固有可靠性和安全性,要实现这个目标,RCM包含3个方面的问题:进行RCMA的依据是什么;分析的内容是什么;如何实现RCMA的结果。第一个问题主要是要研究装备故障规律,结合失效观念的发展,界定关键失效模式、失效时机和失效根源;第二个问题则是维修技术的发展对维修工作效能和分类的影响;第三个问题是研究对形成的计划维修工作单如何取实施。这3个问题都直接或间接的与实际维修技术及观念的发展想关联,本文仅就RCA、预先维修、CBM和TPM等几种现代维修管理或分析技术对RCM的影响作一简要分析。 #p#副标题#e#
3 现代几种先进的维修技术及其对RCM的影响
3.1 RCA及其对RCM的影响
RCA是root cause analysis的缩写,是一种规范化的过程分析方法。RCA调查跟踪事故与事故原因之间的因果关系,直到找到问题的根本原因,并采取相应解决措施予以解决,防止事故再次发生。
根源分析方法起源于美国海军核部门。大多数早期的根源分析法都是通过海军核部门的工作人员和原子能协会的工作人员共同努力而产生的。1979 年,三里岛核反应堆熔化及随之而来的国家实验室对核反应堆操作研究的审查,致使根源分析法在核工业及政府核武器研究领域得到了更加广泛的传播。对突发事件进行调查的专业安全人士发现,海军及原子能研究协会所创造的根源分析方法对特定意外事件的分析非常有效。根源分析法开始渐渐渗入到核操作以外的供健康、安全专家使用的通用知识体中。随着核能、环境部门的ASQ 成员对质量、环境、健康、安全实践相结合可能性的探讨,根源分析很快作为一种可以使这些行业都受益的方法而出现。
Ø 规范化的RCA过程
① 数据收集。对于任何事故来说,数据收集环节都是非常很重要的。RCA的数据收集内容主要包括:故障发生以前、发生的过程中以及发生后的系统的状况和相关的参数;相关的人员行为因素;环境因素;其它涉及到的各方面的信息。对于收集到的数据,我们要对数据的精确性、准确性进行验证,同时要根据获得的事实证据确定数据收集的主要方向。针对主要方向深入进行数据收集,以便使我们采取更有效的纠正措施来防止事故的再次发生。
② 事故评估。事故评估阶段主要是分析数据,确认导致事故的相关因素,总结调查资料,根据故障类别将调查资料分类,针对每种故障类型制定相应的解决方案。
③ 得出事故分析报告。得出事故分析报告是根源分析过程中的重要组成部分。经过事故评估和问题纠正这两个阶段后,我们找出了问题的根本原因,也提出了相应的解决方案。接下来我们就要完成事故分析报告,事故报告主要的内容是说明根源分析的整个分析过程,解释根源分析结果的得出过程,此外,要将事故分析报告拿去和那些与事故相关的管理部门和人员进行讨论,和这些相关人员进行交流。同时将根源分析结果扩展到其它可能存在类似故障问题的装备中去。
④ 结果跟踪。结果跟踪主要用于检验解决方案的有效性,检验解决方案是否被恰当的实施,以及是否完成了预定的功能。为了确保解决方案实施的有效性,我们应对解决方案的实施情况、对方案的日常进度和实施过程中出现的异常情况进行跟踪。同时对那些再次出现的事故应加以确认分析,对解决方案的有效性进行重新评估;对由解决方案引发的新的事故则要进行调查,对解决方案实施过程异常情况控制系统进行评估和改进,以防止新的事故的出现。总之,结果跟踪就是通过跟踪和检验方案的有效性,加强对解决方案的控制和改进,预防新问题的出现。
Ø RCA的特点
① RCA强调对分析过程的质量控制。RCA要求对装备事件形成的整个过程中的每一环节都要加以考虑,即要考虑装备事件形成过程中的不同阶段的各种变化因素,监视任何不能接受的变化。RCA通过逻辑树层次的增加,提出新的假设,逐渐在分析过程中的每一层证明我们提出的假设,使我们的分析有可靠的证据支持。当我们逐层进行这种过程分析,直到最后得出一个正确结论。
② RCA强调分析过程的规范化。与RCM不同,RCA理论认为必须建立一套有效的程序来使分析过程规范化。
③ RCA的最终目的是从根本上消除故障,提高产品的固有可靠性。
Ø RCA与RCM的区别及对其的影响
在RCM中,产品分析的约定层次要求不能太低,故障原因要求与分析层次直接关联,以便找出在相应级别上最有效的维修工作。RCA的目的则是找出故障发生的根本原因,不是直接原因,通常开始进行RCA的层次正是RCM要求结束的层次。亦即RCM与RCA的主要区别是RCM分析事故的表面症状,而RCA找出表面症状的原因;RCM以故障模式为分析的结束点,RCA以故障模式为分析的起点。另外,RCA分析的对象主要是那些经常出现的故障或故障群,而RCM则针对所有对产品功能具有重要影响的项目。
由于RCA是从根本上消除故障根源,使故障不再产生,因此其目的实际上是要提高产品的固有可靠性。而RCM理论则认为产品固有可靠性是先天赋予的,通过维修只能预防故障或故障后果的出现而不是消除它。因此,RCA技术的出现和成熟已经对RCM的理论基础产生了冲击。另外针对所有的故障,只分析到可更换单元一层到底是否最有效和经济提出了质疑。
3.2 预先维修及其对RCM的影响
预先维修,源于英文Proactive Maintenance 一词(缩写为Promaint或PaM,也有译为“主动性维修”的)。从上世纪90年代开始,在西方国家逐渐发展并开始应用。
Ø 基本含义
1992年美国资深的液压系统设计专家E.C.Fitch,在其著作《Proactive Maintenance for Mechanical Systems》中详细论述了Proactive Maintenance的概念、原理和技术[4]。这种维修概念在理论和实践上有其重要的意义,它提出了“故障根源”(Root Causes of Failure)的概念,认为通过对可能引起装备产生故障的“故障根源”进行系统化的识别,在系统的性能和材料退化之前采取措施进行维修,可以有效地减少系统的整体维修需求,延长系统的使用寿命。其基本涵义如下[5]:
① 预先维修强调通过消除或控制故障产生的条件,从故障根源上对故障进行预防,是积极主动的预防故障。这种理论和实践,在装备(资产)的管理中本身并不是新冒出来的。在许多装备、装备中通过各种保养活动,例如检查和严控液压或润滑油质包括酸碱度(PH值)、充氮、干燥剂、密封等都是力图消除或控制故障产生的条件,从根源上预防故障,避免故障损失,延长使用寿命,节省费用和资源。但是传统的技术、方法非常有限。今天的预先维修,强调通过应用各种高新技术手段,如自动粒子计数器、油水分析仪、粘度计、张力计等实现这一目标,监控和消除故障根源,是维修理念和技术上的重大发展。依据实际情况大力推广和开展应用研究有其重要的积极的意义。
② 预先维修有其一定的使用范围和对象,实现预先维修必须具备一定的条件。首先,装备要有所谓的5种故障:条件性故障、初始性故障、临近性故障、急剧性故障、功能性故障;还要求具有先进的检测技术,准确地判定可能引起故障的诱因并在装备的材料和性能退化之前及时采取措施进行维修,恢复和保持装备的稳健运行状态。因此,实施预先维修要看是否有适用的、经济的、有效的预先维修措施;同时,是否实施主动维修要看故障影响、故障后果是否有必要,过早的预先维修措施有可能使零部件的寿命无法得到充分利用。所以,它特别适用于可靠度要求比较高的关键设备或部件。
③ 预先维修是针对故障根源采取的维修措施,包括对故障根源的监测和排除。它可以是现有预防性维修工作形式(保养、视情维修、定期更换、故障检查、重新设计等)中的任一类型或组合。
Ø 预先维修的特点
预先维修不是一种独立的维修工作类型,可以是现有维修工作类型(保养、视情维修、定期更换、故障检查、重新设计等)中的任何一种或组合,它同样要对装备(故障根源)的状态进行检测或监测,并根据需要采取措施。但针对的具体对象、实施的顺序却不同。
Ø 预先维修对RCM的影响
预先维修的实施是RCA的后续措施之一,对具有明显的故障条件形成过程的故障模式才有效。它从故障形成的机理出发,采取相应的技术措施,从而降低形成故障的条件,间接的降低了产品故障率,提高了产品的固有可靠性。因此它与RCA一脉相承,有效的预先维修针对的是产品固有可靠性。这对RCM的理论基础和维修工作类型形成了冲击,也对RCM分析项目层次的合理性提出了质疑。
3.3 基于状态的维修(CBM)及其对RCM的影响
Ø 基本概念
基于状态的维修英语原文为 condition-based maintenance,简称CBM,是指根据对项目定期或连续的状态监测结果所实施的预防性维修。它是一项灵活的、工程式的维修策略,它属于视情维修的一种。同时,它又是联系维修策略、过程和维修技术的平衡器。在实际过程中,根据状态检测、故障诊断分析的结果,结合设(装)备运行的具体状况,确定需要检修时,再安排检修,这样可以减少不必要的人力、物力、财力的消耗,延长设(装)备的运行周期,提高效率。目前又出现了扩展的基于状态的维修(CBM+),它是美国国防部“以部队为中心的后勤事业”(Force-centric Logistics Enterprise ,FLE)6项创议中的一项。其预期的最终目的是在每个武器系统整个寿命期中提高使用可用度和战备完好性。目标是利用有效征兆和诊断工具以及21世纪的维修辅助装置,以明显地改善装备物质状态并减少寿命周期维修负担。CBM+的效益来自于以数据驱动的决策以优化计划预防性维修、进行预计性维修并减少或消除对于许多非计划的修复性维修活动的要求。
Ø CBM特点及其对RCM的影响
CBM与预先维修相似,它也不是一种具体的维修方式,而是指按照指定需求条件下的维修,即只有设施或设备的状态要求时才进行的维修。CBM不是按照预定的时间或使用间隔期进行的维修,通常需要采用先进的技术来检测并评估当前状态。是一种以对装备状态的实时或接近实时估价基础上的维修,这些状态信息通过嵌入式传感器或外部测试以及利用便携装置测量获得。而不做反应性(被动性,运行到出现故障)维修或预防性(定期)维修。
基于状态的维修(CBM)是装备(武器系统)预报初始故障的主动维修的一种形式。CBM是基于实时或接近实时评估装备状态一系列维修活动,装备状态是由嵌入式传感器和(或)利用便携式装置测试与量度得到的。它与被动式(工作到出故障)和预防性(预定)维修原理形成鲜明对照。
CBM把RCM作为核心和重要组成部分,RCM为CBM提供了证据准则。CBM的出现,丰富了RCM的维修工作类型,使逻辑决断流程更加完善。
3.1 TPM
3.1.1 TPM概念
TPM是英文“Total Product Maintenance”的简称,通常翻译为全员生产维修。它是40年前由一位美国制造人员提出。由日本的汽车电子元件制造商——Nippondenso在1960’s后期率先引入维修领域。到1988年西方工业国家开始认识到TPM的重要性并予以推广。从理论上讲,TPM是一种维修程序,起源于“全员质量管理”。 TPM自1970年提出以来大致经历了三个阶段:最初的TPM仅着眼于提高装备性能或有效性,只有5种作业,现在称之为TPM一代(全员生产维修);第二代TPM,是在80年代后期出现的,它着眼于整个生产过程,即整体过程管理(Total Process Management);第三代TPM是在90年代末出现的,它是对整个公司全盘考虑,即全员生产制造/探矿( Total Productive Manufacturing / Mining),它强调的是解决在4M(人员、机器、方法、原料)相互结合中出现的16种主要损耗的8种TPM技术作业,后又将8种支柱性作业扩展成10种:①安全性与环境管理;②着眼于装备和过程改进;③工作区域管理;④操作人员对装备管理;⑤适于TPM的精确维修;⑥教育与训练;⑦人力资源管理;⑧经营与保障系统改进;⑨新装备管理;⑩过程质量管理[7]。
TPM的特点是它在本质上不是一种具体的维修而是一种维修观念。它围绕如何对企业运作过程进行重新思考,以实现企业在资金,品质、生产速度的增长。它鼓励彻底的变革,诸如:使组织结构平面化——少量的管理人员、强有力的团队、有多种技能的劳动人才、对作业的方式进行严格的重新评估——以精化的目标为依据。这些变化也可以一种不断改善企业基层环境的方式来实现,并通过采用适当的检测装置进行监控。
Ø RCM与TPM
对于企业来讲,装备维修有两个目标:一是确定物理部件在当前工作环境下的维修需求;二是尽可能经济有效的完成这些维修作业。RCM通常用于解决第一个目标,TPM则用于解决第二个目标。
RCM主要通过规范化的分析确定装备的实际维修需求,制定适用且有效的维修工作类型,即提高维修策略的效能。其前提条件是要求工业部门具备基本的装备运转条件(如无污染、无松动和无润滑问题),而且操作人员(飞行员)的技能水平、养成和训练要求的标准要高。可是大多数的制造业和矿业公司并不具备这样的基本的装备运转条件和操作人员的技能和作业水平,从而根本谈不上应用任何级别的RCM技术。而TPM恰恰能够解决这一问题。
TPM起源于制造业,强调人的重要性、“能做且不断改进”的理念以及生产和维修人员全体合作的重要性。它被称为整体制造理念的关键组成部分,实际上,TPM过程试图对企业的组织结构进行重塑以挖掘其自身潜力。TPM的目的是进行更好的维修,而实际上经过TPM规划后的维修作业及其计划安排并没有变,变的是具体操作的人员。它通过对整个组织进行重构,强调主人翁意识建立所谓的TPM团队来提高整个公司的质量,这样,就可以确保建立基本的装备运行条件和培训出熟练的操作人员。但是问题是它不能确定到底需要什么样的维修,而这又是RCM的作用所在。
RCM和TPM之间的一个主要区别是RCM用于提高维修策略而TPM则认为单靠维修并不能提高系统可靠性。由于进程需求的不同(如新装备的采用,原材料和过程的变化等)产生的因素,诸如:缺乏细心的操作人员和缺少操作实践经验,落后的基本装备运行条件和装备负载的改变等均对装备可靠性有影响。除非所有工人能积极的、有意识的避免失误减少损失,否则制造业和矿业就不能经济有效的实现早期故障诊断和减少故障。
4 结论
尽管RCM的基本原理和最终目标并没有变,其核心工具逻辑决断图的总体框架也不会变(至少目前还没有迹象),但从上述分析可见,RCM的实体内容必然随着现代维修技术和维修观念的发展而在一下三个方面面临挑战。
Ø RCM的理论基础和维修工作的有效性准则
RCM的理论基础是:固有可靠性是设计和制造赋予装备的先天属性,维修只能保持而不能提高它,即维修只能预防和减轻故障后果,而不能防止故障本身的发生或影响故障规律。因此RCM的结果只是确定了对基于经典观念的常用的和传统的维修工作的需求。先进的维修技术(如预先维修)的出现对传统维修的作用提出了挑战,即:它是否有效在于它能否防止故障的发生,目的是提高装备固有可靠性。但它的前提是找到故障的根源。而现今的事件分析技术如根源分析(RCA)技术的出现并日趋成熟恰恰能够提供这一前提,这样RCA和PROMAINT的有效结合一方面对RCM的理论基础提出了挑战,另一方面也对RCM确定的维修工作需求的有效性提出挑战。这要求RCM不仅在具体的维修技术和逻辑推断上不断完善也要求它在理论基础和维修工作的 有效性准则。
Ø 预防性维修工作的分类
随着预先维修、CBM等新兴维修技术的出现,对RCM中维修策略提出了挑战,要求对维修重新分类的需求也日益明显。作为RCA结果的改进性维修和重新设计以及无预定维修等已成为今后资产管理领域的重要维修策略选项。
随着CBM技术的成熟,维修时机的确定成为一门独立且完善的技术,如何有效的结合状态监控和定时问题必将成为RCM发展的下一个挑战。同时它也对RCM中维修间隔期的确定提供了新的契机。
Ø RCM结果的实施策略
尽管RCM在实践中经受了考验,通过RCM确定的维修工作仍然有效。但很显然,就如何实施RCM的结果,已成为更为广泛应用RCM、有效的削减实施RCM的费用、提高RCM应用效率的瓶颈,RCM本身并不能提高这方面技术指导。因此RCM面临着与其他维修管理技术的结合。目前国际上流行的全员生产维修(TPM)、整体装备系统效能(OEE)等维修管理技术却能从根本上解决维修作业的高效落实问题。因此,如何有效的结合TPM等优秀的维修管理技术必将成为RCM的未来研究方向。
总之,有效的结合新兴技术也必将成为RCM理论的未来发展方向。因此跟踪当今国际上新兴技术,包括制造技术、维修技术、维修观念,的产生和发展对RCM的进一步完善具有十分重要和现实的意义。