中国航空工业总公司可靠性和环境试验管理中心(北京100083)
姜同敏
摘要 可靠性增长技术是随着可靠性增长定量化(增长模型)的研究及其在工程中的应用而发展起来的。本文通过大量的国内外资料,在分析了国内外增长模型研究的基础止,举例综述了国内外可靠性增长技术在工程中应用的现状和发展,以及目前结合我国国情开展的可靠性增长工程活动。
关键词 可靠性增长 历史 现状 发展
一、可靠性增长和增长试验
产品固有可靠性是设计出来的,制造出来的.由于产品复杂性的不断提高及新技术的不断应用,产品更新换代加速.设计一种产品,需要有一个不断深化认识、逐步改进和完善的过程。初始产品(或称为样机)在试验或运行中故障较多,存在许多设计和工艺方面的缺陷。通过有计划地改进设计和工艺,根除故障产生的原因,提高产品的可靠性水平,逐步达到预期的目标。这种有计划的按照“试验一分析一改进”(Test, Analysis and Fix,缩写为TAAF)的程序,使产品可靠性获得提高的过程,称之为可靠性增长。可靠性增长可分两种情况:在研制过程中的增长主要是通过改进设计来达到的;在生产过程中主要是通过对产品的筛选或老炼过程排除产品中的不良元器件、部件和工艺缺陷而得到增长。当然,使用中又会进一步发现设计和制造工艺的不足之处,同时还会不断地收到使用中故障信息的反馈,通过改进产品使可靠性进一步提高。实现可靠性增长的关键在于发现故障,分析原因,并采取纠正措施。为了发现故障,就要对产品进行试验或运行,所以实现可靠性增长离不开可靠性增长试验。
可靠性增长试验是在产品研制过程中有计划地实行试验、分析及解决问题的一个过程.在这个过程中,产品处在实际环境、模拟环境或加速变化的环境下经受试验,以暴露设计中的缺陷。所以,可靠性增长试验是在试验中激发产品故障、进行分析后采取有效的纠正措施、使产品固有可靠性得到不断提高的一种试验。由于可靠性增长试验是通过TAAF过程来提高产品的可靠性,所以它包含了对产品性能的监测、故障分析及其对减少故障再现的设计改进措施的检验。另外,可靠性增长试验本身只能暴露问题,不能提高产品固有可靠性,只有采取纠正措施,防止故障再现才能达到可靠性增长的目的。可见,可靠性增长试验有两个作用:一是通过试验发现故障;二是判断或验证所采取的纠正措施的有效性.
可靠性增长试验是可靠性工程的一个组成部分。从可靠性增长的工程原理可以看出,可靠性增长试验离不开其它的可靠性工作,而其它工作的结果又将体现于或被利用于可靠性增长试验之中,这样才能将这些工作转化为工程上的现实效益。可以说,可靠性增长试验是联结、带动各项可靠性工作的一条主线。它可以作为一种手段来全面审查所有的可靠性活动,因此它是可靠性工程中最重要的项目之一。
应该指出,要注意区分可靠性增长试验和可靠性增长,可靠性增长试验是在产品研制阶段进行,但产品的可靠性增长贯穿了产品的设计、制造、使用和维修的全过程,即在研制阶段结束后,仍然存在可靠性增长的要求。通过使用和维修中发现问题,不断改进产品,提高产品的可靠性。当然,在可靠性增长及试验的概念提出来之前,就已经有人自觉或不自觉地按照TAAF的过程来提高产品的可靠性,尽管那时还没有出现“可靠性增长”一词.然而,这种做法可以说只停留在定性水平上,还没有达到定量要求.应该说,定量化的研究是从可靠性增长数学模型的研究开始的。
总之,可靠性增长是产品可靠性水平不断提高的一种现象或状态。产生这种现象的根源是可靠性增长试验等一系列活动。这种活动造成的可靠性增长现象是有规律可循的,即可以用可靠性增长模型这种数学形式来描述。有了增长模型,研制活动的规划者和管理者就可以利用较为准确的定量方法来计算和评估研制对象的可靠性状态,并且在一定范围内预测末来的可靠性状态,以便就拥有的各项资源作出系统的安排.
二、国外可靠性增长技术的现状和发展
实现可靠性增长离不开可靠性增长试验,增长试验可以激发产品故障,对故障信息又要靠可靠性增长模型这种数学形式来描述,所以可靠性增长定量化的研究是随着可靠性增长模型的提出及其在增长试验中应用而发展起来的。五十年代末期,国外就提出了可靠增长的思想,但在可靠性增长定量化的研究中,具有突破性贡献的是美国通用电器公司发动机与电机部门的一位工程师杜安(J. T. Duane)先生。
1962年,D。先生发表了一篇报告,分析了五种设备(两种航空发电机,一种喷气发动机,两种液压装置)的近600万小时的失效数据,发现了这些设备的累积工作时间在双对数座标纸上呈现很好的线性关系。
Duane模型的出现,不仅使人们看到了可靠性增长定量化的可行性,也使人们看到了可靠性增长定量化的意义。因为有了增长模型,研制计划的管理者就能用它来估计现时刻研制对象的可靠性水平,并且在一定条件下预测达到目标值所需要的时间和其它资源的需求量,以便就拥有的时间、人员、资金做出系统的安排和调整。Duane模型已被后来许多其它的试验数据所证实.目前,Duane模型已成为一种具有广泛应用价值的可靠性增长模型.
Duane模型提出的同年,Lloyd & Lipow(D. K. Lloyd & M. Lipow)提出T他们的Lloyd$. Lipow模型。此后可靠性增长间题引起了国外可靠性工程界的广泛注意,并发表了数百篇论文、报告。美国对可靠性增长间题更为重视,曾在1972年、1979年、1978年、1988年四次召开可靠性增长的学术会议,并发表了会议录(见表1)。同时,各式各样的可靠性增长模型一个接一个地被提出来了.到目前为止,已经有几十个增长模型被应用于可靠性工程之中.如美军标MIL-IDBK-189,按照离散型增长模型和连续型增长模型的分类方法,总共给出了17个增长模型(其中离散型8个,连续型9个)。参考文献〔5〕例举的软件增长模型就有91个。分析这些模型,其中大部分是按照类似Duane的研究思路构造出来的,即分析具体产品的增长试验数据,然后从中益结出规律,提出增长模型。此外,还有一部分是从其它学科领域的实践中总结出增长规律,提出增长模型,然后“引进”到工程可靠性增长领域.如生物学中描述细胞繁殖增长规律的甘培茨(Gompertz)模型。再如,近年来研究较多的非参数增长模型(增长模型也可以分为参数和非参数增长模型)则又是借鉴了经济学领域中分析经济增长趋势的方法而得来的.另外,还有的模型,用“大胆假设”的方法来主观地假设增长过程,然后在此基础上推导出增长的数学模型,当然,这需要以后有更多的合适试验数据来支持这些假设。
在诸模型中,其中最成熟、应用最广泛的是Duane模型,从1962年开始,该模型不但被应用于硬件,还被应用于软件。三十年的工程考验表明,它有广泛的适用性.1978年,该模型首先被美军标MIL-ST。一1655(EC)所采纳.此后,分别于1989年和1987年被美国军用手册MIL-HDBK-338和MIL-HDBK-781所引用。1989年,国际电工委员会(IEC )的TC-56 (CO) 150文件也采纳了Duane模型,当然,Duane模型也有一些缺点,其中最主要的就是没有考虑数据的散布特性,从而不易给出当前的MTBF的区间估计。
表1 美国可靠性增长学术会议概况
[1] AMSAA是Amry Materiel System Analysis Activity的缩写。
[2] IES是Instituted Enviroomentat Sdmoes的缩写。
另一个被广泛应用的是AMSAA模型。为了克服Duane模型的缺点,曾在美军装备系统分析中心(Amry Materiel SystemAnalysis Activity)工作的Crow. L. H在Duane模型的基础上于七十年代提出了一个新模型,称之为AMSAA模型或Crow模型。人USA人模型与Duane模型的故障数均值公式完全相同,但AMSAA模型则进一步给出了Duane模型的概率解释。Crow发展了单台系统可靠性增长的严格统计方法,包括参数及系统MTBF的总估计、系统的MTBF、形状参数的置信区间及模型的拟合优度检验方法.该模型也先后被美国军用手册MIL-HDBK-189,MIL-HDBK-338和MIL-HDBK-781所采用,接着又被IEC的TC -56(C0)150号文件所引用。
另外,随着软件应用的迅速发展,国外已有了数十种软件的可靠性增长模型,但其中有很多是未经工程验证的或者是适用面很小的模型,而且至今尚未推出被公认的通用模型。
为了验证增长模型的适应性以便更好的应用,1975年美国休斯飞机公司(HughesAircraft Company)根据罗姆航空发展中心(Rome Air Development Center,简称RADC)合同,对各种地面的机载系统(或设备)在“内场”和“外场”基本环境下进行了六种模型(Duane模型、IBM模型、指数一单项幕级数模型,Lloyd – Li pow模型、Aroef模型和简单指数模型)适用性的研究工作。这六种模型,每一种都与数据组(地面设备有186个数据组,机载设备有84个数据组)进行拟合。这些数据大多数都是从休斯公司制造的系统中获得的,对于地面计算机和显示器,也从海军舰船系统工程站得到一些外来数据。根据资料[11]提供的数据,从按照地面/机载系统“内场”和“外场”分类进行的拟合优度分析结果来看,没有一个模型在任何场合都优于其它模型,即不存在绝对优良的模型.从机载设备对各类模型的拟合优度分析来看,不同的机载系统有比较好的拟合模型。尽管Duane模型对几乎所有都拟合,但也很少有拟合“最佳”的情况。由此可见,不同类型或不同规模的设备(系统)在研制中遵循着不同的可靠性增长规律。也正是这个原因,可靠性增长模型至今仍在发展.
综上所述,分析国外可靠性增长的发展历史,几十年来主要是围绕增长模型展开的。当然,最近十几年已经开始转向了针对具体问题选择最佳模型的研究。例如上述的休斯公司。这种针对具体问题选择最洼模型的研究,已经逐步转为今后可靠性增长技术的研究主流。因为,对广大可靠性工程师来说,目前面临的急需解决的问题不是缺少增长模型,而是缺少针对具体问题选择最佳模型的基本判别准则。换句话说,也就是众多的增长模型的应用问题.关于应用经验,可以参考文献[11]中所介绍的美国空军机载设备可靠性增长及增长试验的应用经验,本文不再详述。 #p#副标题#e#
三、国内可靠性增长技术的发展和现状
国内可靠性增长技术的研究是随着我国科学技术和工业的发展、国外可靠性增长理论和方法的引入,并结合我国实际情况开展可靠性工程活动而发展起来的.
在可靠性增长的理论研究上,我国最著名的科学家钱学森同志于1975年、1977年和1981年先后三次提出我国要搞“变动统计学”和“小样本变动统计学”的研究.这就是我国最早提出的可靠性增长技术的理论基础.随后就有人从国外引进了Duane、AMSAA和Gompertz等模型,并作了许多工程验证工作.华东师大周延昆教授就是较早开始研究可靠性增长理论的学者之一。他不仅对Duane模型,AMSAA模型的统计分析进行了研究,而且把两个模型应用在沪产电视机的可靠性增长试验上.1985年他又发表了“EDRIC模型分析系统设计中的可靠性增长”的应用报告.北京强度与环境研究所的周源泉和翁朝曦高级工程师是我国较早开展可靠性增长理论和应用研究的另二位专家。他们最大的贡献就是在AMSAA模型的基础上提出了更有普遍意义的AMSAA – BISE模型.该模型解决了Crow先生十几年来想解决而没有解决的多台同步可靠性增长模型及数据处理问题,包括趋势检验、模型拟合优度检验、模型参数及系统MTBF的点估计和区间估计、分组数据及丢失数据的统计推断,以及第r次未来失效的预测区间等问题。另外,还有陈世基、关绍敏、叶尔弊等很多学者和专家对可靠性增长二、三项分布模型参数Bayes估计进行了研究。
从过去的十几年来看,我国可靠性增长技术的研究主要集中在学习消化国外已提出的增长模型,并提出新的增长模型和研究参数估计及统计判断方法等方面。从近几年情况来看,比较多的是集中在可靠性增长管理和增长试验过程中如何应用好已提出的模型。下面仅从国内航空武器装备领域来分析可靠性增长和增长试验的发展和现状。
国内航空武器装备可靠性增长技术的概念和思想也是从国外引进的。可靠性增长技术真正作为标准法规提出来是GJB950-88《装备研制与生产的可靠性通用大纲》(以下简称大纲).该标准是参照美军标MIL-STD-785B并结合我国国情制订的.它引进了美军在武器装备采办中,为提高装备性能、降低全寿命期费用而采用的先进管理思想和先进的技术内容。《大纲》是我国武器装备开展可靠性工作的基本法规,也是订购方在武器采办任务中提出可靠性要求和承制方为达到所需要求而制定具体产品可靠性保证大纲的基本依据.在《大纲》中,首先确定了可靠性增长的概念;其次,把可靠性增长试验作为若干个可靠性工作项目中的一个。《大纲》颁发后,可靠性增长技术就在我国武器装备各部门广泛开展起来.随后,航天部门颁发了QJ1589 -89《可靠性增长试验(人MSAA模型)》;航空部门颁发了HB/Z219《航空产品可靠性增长》;1992年我国又颁发-T GJB1907-92《可靠性增长试验》;目前军标中心正在起草《可靠性增长管理手册》。
随着《大纲》的颁发,又进一步推动了我国武器装备可靠性增长技术的理论研究和应用研究。就航空航天部门而言,最近几年,在机载设备可靠性增长技术方面已经发表了许多学术论文。如北京航空航天大学许海宝教授于1992年针对机载设备外场数据的性质进行分析后,提出该种数据是变动母体的混合数据,它不同于通常用于可靠性估计的不变母体数据。外场数据中含有可靠性增长信息,可以利用外场数据来分析和评估机载设备的可靠性增长.同时根据最小二乘法原理,提出了增长数学模型。同年,他还针对Duane模型的应用,提出如何正确确定总试验时间及影响总试验时间的诸参数(包括增长试验的目标值、增长率、计划曲线的初始值)。再如,北京航空航天大学姜同敏副教授为了解决可靠性增长试验时间太长的问题,针对我国目前新研产品的初始可靠件火平拉低、研制经费较少的情况,提出可靠性增长试验总试验时间的计算方法。还有,北京航空航天大学陆延孝副教授,针对复杂大系统提出采用内厂系统试验和外场试飞相结合的方法,解决复杂大系统可靠性增长问题。
可靠性增长试验在我国刚刚起步.为了提高研制阶段机载设备的可靠性水平,探索机载设备增长试验的路子,原航空航天部许多厂、所针对目前的新研、在研型号的机载设备,进行了可靠性增长试验。例如,原航空航天部三院三十五所对在研型号的高度表进行了可靠性增长试验,并利用Duane和AMSAA模型进行数据处理和分析。其结果表明,试验结束时,当前的MTBF达到了预计值的二倍。其结论为“增长试验确实提高了高度表的可靠性”.高度表的增长试验用了二台产品,参加试验人22人,历时5个月,总耗资40多万元.表面看起来,确实增加了研制费用,但实际上可靠性增长试验是以小的代价换取了大的效益;以充分的地面试验,使高度表的高可靠性确保了武器系统的可靠性。对可靠性增长试验的费用效益,他们进行了对比,其结果是,增长试验所花费的40多万元,仅仅是过去没有进行增长试验而由高度表故障导致导弹靶试失败所造成的损失费用(360万元)的九分之一。
对于新研机种的关健复杂大系统,又是非电子系统的可靠性增长试验的研究和探索,原航空航天部六O三所进行了这方面的尝试.大量统计资料表明,飞机起落架收放系统的故障一般都占飞机总故障率的20%一3000,甚至更高一些。针对这类系统(包括其它液压系统),六O三所采用内厂可靠性增长试验与外场数据相结合的办法进行可靠性增长。在内厂,他们采用现有的全尺寸实体模拟试验台架进行可靠性增长试验.全模台架是为新机进行性能试验准备的,系统所有成品、附件与飞机上的牌号相同,且保证相对位置与飞机相同,基本上能模拟系统所需的使用:条件,同时配备了整套较完整的试验辅助设备和测试设备.当然由于内厂试验施加的环瞬境条件受到限制,单一的内厂试验无论如何也解决不了某些只有在真实环境下才能够暴露的问题,因此必须与外场真实条件的试验相结合,才能确保系统可靠性得到有效的增长。这内厂与外场相辅相成的作用能够充分暴露设计缺陷,使大型复杂非电子系统的可靠性增长有了一定的技术保证,并为这类系统的可靠性增长探索了解决办法。当然,这种办法的效果还有待于进一步验证.
通过实践证明,新机研制阶段,机载设备进行可靠性试验,在试验仅为8~10个循环、试验时间约100小时这段时间内故障率较高,能暴露很多设计上的缺陷.例如XX机综合告普系统及XX机雷达在进行可靠性鉴定试验中,仅仅在试验几个循环后就出现了故障,且故障率较高,使得试验无法继续进行,只好停止试验.后来承制厂进行了可靠性增长试验,对发生的故障进行故障分析,并采取了避免故障再现的改进措施.在第二次试验中几乎没有出现故障,顺利地通过鉴定试验,并完全达到了所要求的可靠性指标。另外,对我国“七五”期间十项电子设备的可靠性鉴定试验的故障情况分析(见表2),可以看出前10个循环的故障约占总故障数的500%。 中国可靠性网!
针对这种规律,可以在设备的环境试验和环境应力筛选试验之后进行8-10个循环约100小时的可靠性增长摸底试验,以消除大部分设计缺陷.这项工作的尝试已经在今年某新研机种的火控系统和电源系统开始实施。可靠性增长摸底试验,一方面减少了试验时间,缩短了研制周期;另一方面可以大大减少试验费用,很适合我国国情(当然,对关键设备还应该进行正式的可靠性增长试验).
可靠性增长摸底试验的基本方法与可靠性增长试验相同,也是通过试验一分析一改进来达到产品可靠性增长,也是尽可能模拟现场实际使用情况施加综合环境应力。所不同的是试验时间短,不需要确定增长模型,以及进行增长跟踪和增长模型检验。
总之,由于我国可靠性增长技术开展较晚,可靠性增长试验刚刚起步,目前还存在许多管理和技术上的问题需要进一步理顺和解决。例如,实施可靠性增长试验的经费问题耗资太大,增长试验与其它试验是否可以综合实施问题;应使用什么增长模型,制订计划时应采用什么起始点和增长率;究竟需要多少试验时间合适等一系列问题都需要慢慢摸索并结合我国国情来解决。
参考文献
[1] Duane J. T, Learning Curve Approach to Reliability Monitoring, IEEE Trans. on Aerospace, 2, pp563-566,1964.
[21 Lloyd D. K and lipow M, Reliabiity Management, Methods and Mathematics, Englewood Cliffs, NJ; Prenticc-Hall.1962.
[3] 周源泉、翁朝曦,可靠性增长,科学出版社,1992.
[4〕MIL-HDBK-189, Reliability Growth Management,February, 1981.
[5〕Yamada and 0saki, Reliability Growth Models for Hardware and Software Systems Based on NHPP; a Survey, Microelectronics and Reliability, 23, PP91一112,
[6〕MM-STD-1635 (EC),Reliability Growth Testing, 1978.
[7] MIL-HDBK-338, Reliability Design Handbook for electronic Equipmcnt .1984.
[8] MIL-HDBK-781 .Reliability Test Methods, Plan and Environments for Engineering Development,Qualification and Production 1987.
[9] IEC TC-56 (CO) 150, Reliability Growth MedoLs and Estimation Methods, 1989.
[10] Crow L. H,Reliability Analysis far Complex Repairable Systems, US Army Mcteriel Systems Analysis Activity, Technical Report 138,1975.
[11] 航空航天工业部第301所,可靠性增长试验与环境应力筛选,1990. 12.