华为的可靠性设计工作就是从无到有,在摸索中开展起来的。一开始由于产品开发工程师基本没有任何可靠性工作的基础,所以最初的阶段,我们几个可靠性工程师一方面要加强对开发人员的可靠性基础知识和技术培训,一方面自己也要在可靠性工作的实践中不断探索。
因为在培训中,我们不能只给开发人员做理论和方法的介绍,还必须给他们拿出结合他们自己产品的“实例”来。为此,我们又补充了几个人员,尤其是引入了具有产品开发经验的工程师,形成了一个初步的可靠性团队。
这个最初的团队以某型交换机产品为案例先自行做起了可靠性分析工作。这个交换机一共有十几种单板,我们几个人就分工,每人一块单板,自己亲自做可靠性分析。
要做好产品的可靠性分析,就必须懂产品,于是我们从交换机原理,直到每个器件的功能、参数,做了全面深入的学习,不懂就向开发人员请教,知道了每个器件、每个信号、每块单板、每个模块,以至整个产品的功能,在此基础上完成了FMEA的分析报告。
用这些分析结果作为实例,再给开发人员培训FMEA技术,有了结合自己产品的可靠性分析实例和分析过程中总结出来的经验,开发人员理解接受起来就会相对容易一些,就这样,我们完成了华为公司第一个产品的可靠性分析工作!
依此类推,我们又相继完成了产品的可靠性建模、预计、测试等其它的可靠性分析工作,这些实践为以后华为可靠性工作的全面推行奠定了基础。
随着可靠性在交换机产品线上的逐步展开,可靠性的意识也在整个公司越来越深入人心,其它产品线也对推行可靠性设计产生了浓厚的兴趣。华为公司有着众多的产品线和产品,此时我们可靠性部门的工程师只有十来个人、七八条枪,所以只能选一些重点的产品投入。
籍此,可靠性部门开始化整为零,每名工程师被分派到不同的产品线上,负责不同产品的可靠性工作。由于产品众多,又在不断变动,所以可靠性部门的每个工程师都在多个产品线做过不同产品的可靠性分析工作,积累了丰富的可靠性设计经验。
2002年左右,公司开始全面引进和推行IPD开发流程,这也为可靠性的流程化提供了极好的历史契机。同时,经过几年的实践,我们在可靠性技术上已经积累了大量的经验,开始按流程化要求制定每一项可靠性工作要求,这为可靠性工作融入IPD开发流程创造了条件。于是顺理成章地,可靠性工作实现了流程化。
流程化的好处就是可靠性工作从此摆脱了靠“人为推动”的局面,而成为流程节点中必须完成的步骤。各个产品线要按照流程完成可靠性工作,当然就要配置可靠性工程师岗位。这样华为公司内部就有了两类可靠性工程师:产品线上的可靠性工程师和可靠性部门(现在归属于2012实验室)的可靠性工程师。
当我们可靠性部门的工程师把流程化所需的支撑性文档、规范完成之后,就可以抽身出来做更多更前沿的可靠性技术研究和探索,这实际上相当于建立了可靠性工作的矩阵式组织架构,这个架构一直延续至今,为公司整体可靠性工作的发展起到了重要的组织保证作用。