点击上方“公众号”可以订阅哦
引言
技术状态管理是美国二战中后期,在发展导弹核武器过程中发展起来的一门工程管理控制技术。各国都对技术状态管理要求和方法开展了大量的研究工作,形成了诸如ISO 10007:2003、ANSI/EIA649-B、GJB3206A—2010、ECSS-M-40C等标准规范,强调分层次、分阶段管理,重视技术状态标识、控制、审核和纪实4个要素。近年来,技术状态管理理念被各行业广泛研究和应用,尤其在航空构型管理和软件配置管理方面的研究比较多,软件配置管理在定量评价方面略有领先。宇航元器件技术状态管理同样执行上述标准,但是在对国内宇航元器件生产厂的调研中发现,国内宇航元器件技术状态管理在具体要求和控制方法的研究方面仍有欠缺,导致部分生产厂没有真正理解其内涵和作用,在实施过程中流于形式。针对这些具体情况,本文后续提到的技术状态管理是指生产厂在设计、生产、质量保证等过程中对宇航元器件实施的技术状态管理工作。
宇航元器件技术状态管理现状
宇航元器件作为宇航型号的最基本单元,对航天产品的性能和质量起着至关重要的作用,核心元器件的技术水平是国防科技工业水平的重要体现。与宇航型号等复杂系统相比,大部分元器件通用性强、生产批量大、生产自主性强。元器件若存在技术状态问题,其影响范围较广,故对元器件产品技术状态的固化有很高的要求;元器件生产自主性强,也给技术状态管理、监督增加了难度。另外,部分国产元器件没有经过认证的、状态稳定的材料可供选用,每个批次原材料的性能参数可能会有细微差别,或是元器件的生产过程中需要大量使用国外材料,这都导致固化产品的技术状态较为困难。如瓷介电容器生产用的不同批次瓷料的介电参数一般有差别,导致达到同样电容量的电极层数可能有区别,设计准则中难以定量进行固化描述。通用元器件自成系统,研制过程中涉及的接口关系相对少,但在使用元器件时,不同用户可能对元器件技术状态有不同要求,而实际上用户很少直接参与元器件技术状态的管理;国军标元器件有专门的鉴定机构,宇航元器件有专门的质量保证机构,使得元器件的技术状态管理涉及较多的单位。
GJB 9001B要求所有单位都要开展技术状态管理工作,同时对技术状态控制和过程管理等还需要用户的参与和监督。对于技术状态管理工作,国产宇航元器件生产厂一般都执行GJB 3206A—2010《技术状态管理》,对其进行细化的程度有限。结合近年来国产宇航元器件质量保证工作来看,宇航元器件技术状态管理在整体管理计划和要求制定、产品基线全面定义和更改必要性论证、验证充分性方面还存在一定的问题,影响整体产品质量与可靠性的提升。
1.1 技术状态管理计划不细致
部分生产厂仅按照GJB 3206A—2010编写了相应的技术状态管理程序和计划,但是没有结合单位的实际情况制定具体可执行的要求,尤其在新品鉴定前,元器件产品的更改记录、审批程序不完善,导致技术状态文件与产品实物不一致,造成进度拖延及成本增加。如:某产品验收时发现,某型旁路开关触点环镀层与设计文件不一致。经复查,产品设计文件规定的触点环工艺为研制新品时提出,后续改进工艺固化时未进行修订。
1.2 产品基线不明确、不全面
部分生产厂对元器件基线的定义不明确、不全面,生产中随意改变材料、设计,导致不同批次产品技术状态不一致,甚至无法使用。如:为了满足合同厚度的特殊要求,生产厂擅自在电容器生产时对产品采取了增加护片厚度的方式,导致前后2批次产品厚度存在不一致,其中1个批次产品存在安装问题。
1.3 更改必要性和验证不充分
在技术状态更改时,对更改必要性的论证和验证分析不充分,导致小改出大错。如:生产厂对某型号电源变压器进行改进时,把原来的3股漆包线改为4股,出现了漆包线的焊点过大,超过变压器骨架底面安装支撑脚的高度,以致安装后不稳定的新问题,整批产品报废。
技术状态管理计划
根据能力成熟度模型,可以将技术状态管理的水平分为5个等级(见图1)。目前,多数元器件生产厂的技术状态管理水平仅能达到管理级和定义级,需要结合具体产品情况制定技术状态管理计划,细化管理模块和技术库,进一步开展量化评估方法研究和应用。
图1 基于能力成熟度模型的技术状态管理水平
Fig. 1 CM Level based on the capability maturitymodel
技术状态管理计划是整个技术状态管理过程的基础,结合目前宇航元器件的具体情况,建议充分考虑以下内容:
1)事前规范。在产品研制之前和研制之初,定义技术状态管理方面相应的流程和规范,并成立相应的组织机构,明确元器件技术状态基线涵盖的要素。
2)事中控制。明确元器件可度量的功能特性和物理特性,使生产厂和用户的采购、生产、使用等活动有共同的基础。对研制、生产过程进行严格控制,建立完整严密的评定、批准的要求,完善闭环落实机制。
3)事后追溯。使各阶段的状态和过程记录信息能够进行完整的追溯。
元器件技术状态基线
3.1 基线要素
技术状态基线是被批准的技术状态文件,功能基线、分配基线和产品基线关系见图2所示[2]。研制过程是一个分析—设计—验证反复进行、设计不断完善的过程,更改不可避免,技术状态也在持续变化,没有一个明确、统一的基线定义[3]。功能基线和分配基线的概念在元器件研制过程中并没有完全得到体现,仅是后期产品基线的基础,对基线变化的控制也不能被简单地理解为对“技术状态更改”的控制,因此本文讨论的技术状态更改主要针对产品基线更改。
图2 技术状态基线
Fig. 2 CM baseline
产品基线在设计定型后确认。对于宇航元器件产品基线,除了能够明确在产品本身体现的特性,如性能指标,还包含影响生产过程要素、产品使用要求等,详见表1。
表1 元器件技术状态基线要素
Table 1 CM baseline elements of parts
分类 |
要素 |
元器件物理特性 |
结构、材料、外形尺寸、型号规格、表面状态、标识(含表面标识、芯片标识,若有)、重量 |
元器件性能指标 |
基本力、电、热、光参数指标 极限力、电、热、光参数指标(适用时) 环境适应能力:如抗辐射能力、抗静电能力 |
元器件过程控制要求 |
人员、生产组织、设备、原材料、关键过程、工艺、工艺检验、过程检验、外协 |
元器件可靠性试验要求 |
基本可靠性试验方法和判据、筛选试验、鉴定检验、批接受试验、周期试验 |
元器件储存和使用要求 |
包装、储存环境要求、使用环境/应力要求 |
3.2 技术状态文件与过程确认文件的关系
宇航元器件一般都建立了过程确认文件(PID)[4],充分利用原有的质量体系以及相关设计工艺和操作类文件进行细化和全面的规定,其目的是能够固化产品的质量。PID在产品定型后建立,关注生产、保证涉及的所有过程;技术状态文件关注的是全寿命周期的产品特性;两者关系见图3所示,两者的交集是产品基线,即:元器件定型后,在元器件PID中正式确认的,并被作为元器件采购、生产、质量保证、使用等活动的参照基准,以及技术状态改变判定基准的技术状态文件。
图3 技术状态文件与PID的关系
Fig. 3 Relationship between CM &PID
技术状态更改控制方法
4.1 分类控制
为了优化技术状态更改控制涉及的资源,可以根据对元器件实物性能、可靠性的影响程度分类控制,重要的更改可能影响元器件实物的状态。元器件技术状态分为3个类型,一类更改是指可能涉及元器件实物状态变更的更改,包含可能引起用户技术状态变更、可能涉及元器件性能、可靠性、安全性的所有技术状态更改;二类更改是指可能不涉及元器件实物状态变更的一般技术状态更改;三类更改是指不涉及元器件实物状态变更的技术状态更改,典型情况见表2所示。
表2 3类技术状态更改的典型情况
Table 2 Typical cases for 3 CM change types
一类更改 |
二类更改 |
三类更改 |
元器件内部功能区域结构变化 元器件接口特性变化 外形尺寸、重量变化 型号规格变化(或增加系列规格) 性能指标变化 贮存环境要求变化 使用应力要求变化 关键原材料变更 工艺变更 关键工序(零件)外协单位变化 生产线搬迁 试验条件或要求放松 |
元器件内部非功能区域结构变化 表面标识变化 包装变化 辅助生产用的材料更换 工艺技术指标优化 试验设施转移 更换生产设备 关键人员变更 增加过程检验、试验要求 技术文件中引用的标准规范变化 试验条件或试验要求加严 |
普通人员变更 技术文件中引用的标准规范改版 技术文件勘误 统一标注 |
4.2 控制原则和流程
技术状态更改控制应遵循“论证充分、各方认可、试验验证、审批完备、落实到位”5条原则要求。结合以上原则,推荐的技术状态更改流程见图4所示。
图4 技术状态更改流程
Fig. 4 CM change flow
技术状态更改需求由元器件生产单位、质量保证机构或某个元器件使用单位首先提出;元器件生产单位根据产品具体情况判断是否必须进行技术状态更改,才能够满足预期的性能指标要求或使用要求,初步确定技术状态更改内容;根据技术状态更改影响的程度确认技术状态更改类型,并对一类更改、二类更改内容进行可行性分析、试验验证,明确技术状态结论。涉及元器件性能指标、接口特性等一类更改情况,应根据实际情况确定是否同时进行产品型号规格等相关技术状态更改;在技术状态更改结论审批通过后,将更改落实到文件和实物中。对于验证试验设计、技术状态更改结论与审查等关键环节,为避免考虑风险和应对措施不充分,需要用户、质量保证机构的认可。
4.3 技术状态更改风险定性分析
在元器件技术状态更改中,风险的存在是必然的。而元器件功能不同、更改内容不同,所导致的风险因素也不同。在更改论证阶段,需要针对具体情况对风险进行分析,确定更改的可行性。
在国产宇航元器件技术状态控制中,应重点关注以下9个方面的高风险问题:
1)新材料。对未经验证的新材料的选用合理性、使用正确性进行分析和验证,尤其是对关键新材料。如:电连接器的金属材料牌号变化,应进行材料特性分析(抗拉强度、硬度、密度等),工艺验证(加工工艺参数、装配工艺参数),产品的结构分析、鉴定检验、应用验证。另外,大部分宇航元器件都需要考虑非金属新材料的释气特性、抗辐射特性。
2)新结构。从结构本身和产品2个维度进行分析验证,对于涉及接口特性改变的新结构,需考虑进行应用验证。如:集成电路IP核更改,要进行IP核或单元库的评价和验证,对产品还要进行稳态寿命试验和A组电测试。
3)新工艺。对首次采用的新工艺的条件设计合理性、文件完备性、工艺稳定性进行分析和验证。如:有源器件中芯片粘接方法的改变在进行工艺条件分析验证的同时,还要对产品进行热冲击、温度循环、耐湿、密封、电测试,机械冲击、扫频振动、恒加速度、密封、电测试2个分组的试验验证。
4)新环境。最主要的风险事件是生产线搬迁,对产品在生产、装配、测试、试验、储存、运输等环节中的新环境进行识别,并对产品适应性进行分析和验证。
5)新设备。对产品在生产、装配、测试、试验等过程中使用的新设备的可靠性、安全性进行分析和确认。
6)新单位。对首次承担外协任务或作为供方的新单位,对其资质、质量体系运行情况、产品保证措施等进行检查,并设置针对性接收检验进行验证。
7)新岗位。对新设岗位的职责、岗位规范的完备性进行检查和确认。
8)新人员。对首次上岗关键岗位人员的素质、责任意识、上岗培训等情况进行检查,特别要对新人员在专业技术、岗位技能方面进行考查。
9)新流程。对全新流程应从流程要素的全面性、保障条件的充分性、流程目标可实现性和流程结果可考核性等方面可能存在的技术风险进行分析。
4.4 基于风险因子测度模型的技术状态更改风险分析
运用风险管理的定量分析方法对更改可行性方案的风险程度进行量化,给出量化指标,为风险预策提供量化依据。本文采用风险因子法进行了某型产品镀层材料技术状态更改可行性的量化分析。
4.4.1 风险因子法的基本原理
将风险定义为更改后元器件不能在预定的成本、时间和性能指标范围内完成的概率以及由此产生的后果,可用失败概率P和失败后果C这2个变量表示为
R=f(P,C)。
其中R为元器件更改的风险。失败概率的区间为[0,1],0定义为完全成功,1定义为完全失败。
用yRPF表示风险因子,假设Pf(失败概率)与Cf(失败后果)相互独立时,可得:
yRPF=Pf+Cf–PfCf=Pf+Cf 。
4.4.2 失败概率的确定
按照结构、材料、工艺、环境、检验、设备、人员对失败的作用分别赋予不同的权重系数αi。记向量A=(α1, α2,α3, α4, α5,α6, α7)。对上述7个因素进行评定,按照量级值分为5个等级来评估各因素作用程度,如:A=(α1, α2,α3, α4, α5,α6, α7)=(0.2, 0.2, 0.2, 0.1, 0.1, 0.1, 0.1);B=(b1, b2,b3, b4, b5)=(0.1,0.3, 0.5, 0.7, 0.9)。由有关专家组成的风险评估小组参照表3选择各因素的权重量级,则失败概率为
其中:E为组成的矩阵,为选择i因素j量级的专家比例。
表3 不同量级时失败因素的含义
Table 3 The definitions for failure factor atdifferent levels
量级 |
结构α1 |
材料α2 |
工艺α3 |
环境α4 |
检验α5 |
设备α6 |
人员α7 |
0.1 |
相似产品已用 |
相似结构已用 |
相似产品已用 |
在一定范围内调整 |
相似产品已用 |
相似产品已用 |
相似产品参与人员 |
0.3 |
局部重新设计 |
同类型产品已用 |
局部重新设计 |
局部搬迁且可行 |
加严要求 |
非关键工序设备已验证通过 |
非关键岗位新人员 |
0.5 |
主要变更但可行 |
主要变更但可行 |
主要变更但可行 |
搬迁,但可行 |
主要变更但可行 |
非关键工序最新设备已验证 |
关键岗位变化,但已考核通过 |
0.7 |
技术可行的复杂设计 |
已通过试验验证 |
技术可行的复杂工艺 |
搬迁,首批产品已鉴定 |
已通过试验验证 |
非关键工序最新设备已验证 |
新岗位新人员,但已考核通过 |
0.9 |
最新技术,某些研究已经完成 |
最新材料,某些研究已经完成 |
最新工艺,某些研究已经完成 |
搬迁,某些分析已完成 |
最新技术,某些研究已经完成 |
最新设备,某些分析已完成 |
新岗位新人员,某些分析已完成 |
4.4.3 影响程度因子的确定
对失败后果影响程度的估计从技术、费用、进度3个方面衡量,采用模糊综合评判法进行。设综合评判的因素集U={技术,费用,进度},评价集V={低,较次要,中等,显著,高},使用评价集评价,参照表4。
表4 不同量级时的失败后果影响因素含义
Table 4 The definitions of failure effects atdifferent levels
量级 |
技术因素 |
成本因素 |
进度因素 |
0.1 |
影响很小或没有 |
不超过成本,资金分配有所变动 |
对计划影响可以忽略 |
0.3 |
性能可靠性少许变化 |
成本增长1%~5% |
进度推迟不超过1个月 |
0.5 |
性能可靠性有一些变化 |
成本增长5%~20% |
小的进度推迟 |
0.7 |
性能可靠性有显著变化 |
成本增长20%~50% |
进度推迟超过3个月 |
0.9 |
不能达到性能可靠性指标 |
成本增长50%以上 |
进度推迟以致影响目标实现 |
由有关专家组成的风险评估小组参照评价集V,可得评判矩阵K为由 组成的矩阵。例如对于因素的权分配F=(0.55,0.1, 0.35),评价集各元素赋予量值V=(0.1,0.3, 0.5, 0.7, 0.9),对于风险的模糊综合评判D是V上的模糊子集,即
D=FK,
对D进行归一化处理得到,
D′=(d1, d2, d3,d4, d5),
则失败影响程度Cf可以表示为
Cf=D′VT=0.1d1+0.3d2+0.5d3+0.7d4+0.9d5。
4.4.4 风险因子的计算
利用公式(1)~(6)可以求得风险因子作为判断项目风险的依据。例如规定yRPF>0.7为高风险项目,不建议进行更改;yRPF介于0.3~0.7之间为中等风险,需要进一步采取相应措施;yRPF<0.3为低风险,可直接实施。结合各因素打分数据,对某型产品镀层材料更改可行性进行风险因子计算,得到yRPF=0.25,故可认为该项更改为低风险,可直接实施,与对该内容进行专家评审的结论不谋而合。
结束语
宇航元器件技术状态管理实施应在PID的基础上,元器件生产单位应对于每一系列元器件进一步明确产品基线要素,并用确定的程序管理更改工作。明确和稳定的基线是技术状态管理的依据和研制工作的基础。对基线的更改会对元器件的功能、性能、可靠性特征,甚至成本、进度产生重大的影响,必须严格控制。元器件技术状态控制,就是对元器件技术状态更改实现过程的技术风险识别与控制,一方面为具体技术状态更改内容提出可行性分析验证项目;另一方面用风险分析方法评价更改风险,帮助决策实现。用科学的方法进行更改控制,能够提升国产宇航元器件的整体质量控制水平。
作者:汪 悦,张红旗
来源:五院ECRC