电子器件失效分析及可靠应用

电子器件失效分析及可靠应用

   通过学习本课程,使学员学习到器件常见失效模式、失效机理、失效分析流程等,通过大量的失效分析案例讲解,加深学员对失效分析的理解,掌握失效分析技能。

深刻体会到电子产品可靠性的根本含义。
   集中讲授各类器件的失效模式和失效机理,帮助学员快速分析器件的失效问题,并进一步掌握器件的可靠应用要点,帮助学员快速提高器件的应用水平,帮助企业提高产品的可靠性水平。

课程简介
详细附件下载:电子器件失效分析及可靠应用

目录
引言:电子可靠性工程概述
一、失效分析基础
二、典型失效模式
三、典型失效机理
四、器件失效分析流程
五、破坏性物理分析(DPA)介绍
六、静电损伤
七、CMOS集成电路的闩锁效应
八、如何和器件供应商交流失效分析
九、典型失效分析案例介绍
十、各类器件的失效模式、机理和可靠应用要点

开展电子可靠性工程工作的意义
 中国现在是制造大国,还不是制造强国,为什么?
 国内电子厂家经常面临问题:由于产品问题多导致客户满意度下降;价格只是国外竞争对手的几分之一,利润低。但是还是竞争不过,竞争力差,为什么?
 作为消费者,我们都喜欢买美欧日进口产品,为什么?
 重要的原因是:我们的产品质量和可靠性差,国内电子产品和国外领先的差距不是功能性的差距,而是质量和可靠性上的差距。
 质量和可靠性差的主要原因是:设计水平低,缺乏硬件应用经验,缺乏电子可靠性系统工程方法。


 可靠性首先是一门专业技术,然后才是一种管理方式。
 我们认为:仅靠个人经验和责任心是无法根本提高设计水平的,最主要的是缺乏一套完整的系统方法,“君子授人以鱼,不如授人以渔”。


  贵公司是否统计过产品的市场返修率和生产一次通过率?
  贵公司是否统计过器件的失效率?
  贵公司是否有返修率很高的产品或器件?
  贵公司是否统计过单位产品的维修成本?
  贵公司是否统计过上述损失成本是多少,占销售收入的比例是多少?


 现状:国内很多电子企业的产品生产一次通过率低于90%,市场返修率高于5%,据此推算,这类企业的质量成本将会达到销售收入的15%。
 提升价值:如果某产品的年产值为1亿元,年返修率为5%,直接损失最低500万元。据经验,失效率排在前3位的器件一般占该单板总失效率的80%以上,找出这3个器件的失

效原因,进行改进,则该产品返修率可以在很短时间内降低到1%以下。则失效分析改进带来的直接收益为400万元。而间接收益可以达到千万元以上。


  根据我们的经验,打开电子可靠性工程大门的钥匙是失效分析。
  失效分析可以立即准确解决目前困扰企业最严重的产品问题,效果立竿见影,创造明显的价值。赢得领导和大家的认可,为后续开展可靠性工作赢得必要的支持和投入。
  可以积累产品的可靠性设计经验,提高公司开发水平,为后续产品可靠性打下良好的基础,真正的提高公司的核心竞争力。

  可靠性是一种概率事件。
  产品的可靠性是使用的所有器件可靠性的累加。虽然每个器件的失效率仅有几十个PPM以下,但是单板的失效率却可以达到百分之几以上的数据。
  虽然某个具体单板上的器件失效不是很平均地表现出来,而是少数器件的失效率很高,而大多数器件的失效率却很少。但是统计更多的产品和单板时会发现,每个器件都

存在失效的概率,所有器件的失效率趋于平均。
  谁也没有办法准确预测某个单板上哪些器件的失效率高,哪些器件不会失效。

开展电子可靠性工程工作的意义
 实施可靠性的根本方法:
  要保证产品的可靠性,唯一的方法就是考虑单板上所有器件都存在失效可能,并充分考虑这些器件的主要失效机理,并防止这些失效机理的发生。
  一个单板上往往有成百上千个器件,每个器件都有多种主要的失效模式和机理,可靠性工程的目标就是掌握和应用所有器件的主要失效机理以及预防措施。
 往往最笨的方法,就是最有效的方法。


 国内电子企业的硬件工程师往往是依靠个人的经历来积累一些可靠性知识,不可能全面和深入。
 公司层面上没有注重技术积累。意识、考评机制和方法等都比较缺乏。
 以上原因造成国内企业和工程师的可靠性技术水平停留在初级的水平,产品可靠性不稳定。


 可靠性是概率事件。一个发展中的企业往往没有足够的能力去控制产品可靠性。能够生存下来往往是“幸运”的结果。
 但是,幸运不可能伴随企业的一生。随着产品的种类和产量不断扩大,以及时间的推移,不及时提升产品的可靠性,注定会付出惨痛的代价。

可靠性工作在什么阶段进行?
概念开发
测试
试产
验证
生产试产
失效分析,并积累成为电子可靠性工程平台
器件选用(包括器件搜索、认证和选型)
可靠设计应用(应用CHECKLISH、CBB、规范等的可靠性方法)
对开发测试中出现的器件进行失效分析
对试产和可靠性增长试验中中出现的器件进行失效分析生产可靠性(ESD、MSD、可加工性)
生产器件失效分析对市场返修单板失效 器件进行分析

电子可靠性工程主要内容

通过正确的选型认证来保证构成产品的物料的基本可靠性  
 物料选型与认证是一项产品工程,是硬件开发活动的重要组成部分。产品一旦选用了某物料,其质量、成本、可采购性基本上60%都已固化,后期的一系列改进、保障策略

所达到的效果只能占到40%,物料选型影响重大。如何确定物料的规格,如何识别不同厂家的物料优劣,如何对物料厂家进行
认证,如何监控物料厂家的质量波动,这些专项技术,在国际领先公司都有专业的团队来进行研究,并有系统化的流程
来保障物料选用,而目前国内厂家普遍比较薄弱,因此从物料选用开始,产品质量就和业界领先公司拉开了差距,可以
说是输在了起跑线上。
企业需要建立各类器件的认证规范和选型指导书,提升器件选用过程的效率和质量。

通过正确的选型认证来保证构成产品的物料的基本可靠性

通过正确合理的设计方法保证应用可靠性
  常用的可靠性设计方法有如下14种,在产品开发过程中,这些方面都要考虑到,包括借助相应的仿真工具进行分析,才能够保证设计的产品的可靠性。
1)可靠性预计 与FEMA
2)可靠性指标论证、分配与冗余设计
3)电应力防护设计
4)ESD防护设计
5)降额设计
6)信号完整性分析
7)EMC设计
8)热分析和设计
9)容差分析
10)安全设计
11)可生产性设计
12)升额设计
13)环境适应性设计
14)寿命与可维护性设计
国际领先的大公司,对这些设计方法均有专业团队来保障。国内企业如果要提高其可靠性设计水平,应该建立自己的设计准则库(checklist)、标准电路库(CBB)和各种

专项设计规范。使其形成公司的可靠性工程平台,不断积累和提升公司研发能力。

在加工维护过程中保证不引入对器件的损伤ESD,产品线的ESD控制水平是多少?
MSD,器件的潮湿敏感等级有几级?
造成0603表贴电阻失效的主要原因是什么?
在生产加工过程中,影响可靠性的最主要的因素是ESD、MSD和工艺可靠性,这三方面的控制技术目前发展得较为成熟,也有对应的国际标准,但是国内很多厂家还做得不够

完善,象ESD控制不好引发的可靠性问题,往往是在产品到用户手里半年以上会大量爆发。因此怎样控制加工过程,保证对不引入对器件的损伤需要引起重视。在产品维护保

养过程中同样要考虑可靠性问题,避免引入对产品的损伤。国内电子企业应该建立或完善内部规范和操作指导书。

流程保障
电子产品可靠性工程是非常严谨的系统工程,需要高效、明确的流程来保证。可靠性保障流程主要有三个:
1)物料选型和认证流程,包括物料选型,物料认证,供应商认证,供应商质量控制等方面;
2)产品开发中的可靠性设计流程,在产品开发过程中保证上文提到的14种方法的使用以及明确评审要求,通过可靠性设计来保证产品的可靠性。
3)FRACAS流程,通过对故障数据的分析处理,找出异常问题,启动根本原因分析,找到解决措施和预防措施,使所有问题都能够闭环,以保证产品的可靠性。

详细附件下载:电子器件失效分析及可靠应用

#p#副标题#e#
目录
引言:电子可靠性工程概述
一、失效分析基础
二、典型失效模式
三、典型失效机理
四、器件失效分析流程
五、破坏性物理分析(DPA)介绍
六、静电损伤
七、CMOS集成电路的闩锁效应
八、如何和器件供应商交流失效分析
九、典型失效分析案例介绍
十、各类器件的失效模式、机理和可靠应用要点

一、失效分析基础
1、失效分析的产生与发展
2、失效分析的目的和意义

1.1.1 失效分析的产生与发展
 可靠性技术的发展源于器件的失效。
 研究器件的失效不是简单的定位和维修,而是通过深入分析器件内部的失效特征,找出失效原因,从而为最终解决问题打下坚实的基础。
 失效分析是可靠性工程的基础,只有通过失效分析才能解决失效,降低故障率,积累经验,提高技术水平。

1.1.2 失效分析的目的和意义
传统的器件失效分析是对失效器件进行的分析,从材料、结构、设计、制造工艺和使用等方面,通过物理、化学的分析方法来确定失效模式,分析失效机理,判断失效性质

、假设失效原因。
现在的失效分析不仅仅是传统的失效模式和机理的分析,而是根本原因(Root Cause)分析,找到根本原因,提出改进措施,解决问题,更重要的是提出预防措施,在新产

品开发中避免类似的问题发生。

二、典型失效模式
失效模式是器件失效后表现出来的宏观现象和特征,它不需要解剖器件即可获得。主要有:
1、开路
2、短路
3、功能丧失
4、功能退化:如漏电流增加,耐压劣化,参数漂移
5、重测合格
6、机构不良

三、典型失效机理
 失效机理是指由于物理、化学、机械、电、人等原因引起产品失效的机理。该定义中的产品是从大的系统到器件、部件、材料等的总称。
 如果针对半导体器件的情况,失效机理是导致器件发生失效的物理、化学变化过程,如介质击穿、金铝合金引起键合点抬起、钠离子沾污导致的PN结劣化、闩锁效应引起的

烧毁等。根据失效机理,可以判断导致器件失效的根本原因,进而提出相应改进措施。

三、典型失效机理
1、电应力
√雷击浪涌
√ESD
√电源上下电
√带电插拔
√器件闩锁
√过压
√过流
√冲突
2、热应力
3、机械应力
4、环境应力
5、寿命应力
6、来料缺陷

四、器件失效分析流程
1、解剖前的过程
2、解剖
3、解剖后的分析过程
4、编写失效分析报告
4.1 解剖前的过程
生效情况调查,总结失效数据测试(功能、I-V曲线测试)模拟实验 外观镜检nX-RAY检测
超声扫描失效模式分类
调查失效环境,器件使用过程信息,器件失效率,器件失效的异常行为、异常现象。
单板上测试器件功能是否正常;
搭建应用电路测试器件功能。
对于功能测试正常的器件,建议进行模拟实验,确定是否存在使用问题,加偏置不当,外围电路影响等。
检测镀层质量、引脚的锈蚀情况;
引脚根部和密封处的机械损伤及密封缝的质量;
外观标志。
检测内部结构及金属多余物检测潮气引起塑封器件的内部分层进行失效模式分类,如开路、短路、参数退化、时好时
坏、重测合格

4.3 解剖后分析过程 ———失效分析思路
1、器件失效分析思路有两个主要过程:正向和逆向分析。
2、逆向分析,即从器件的失效模式和机理中推测器件的主要失效原因。
3、正向分析,即从检视器件应用是否正确的角度分析。

● 失效重现是判断失效分析结论是否正确的重要依据,但不是充分依据。
● “青蛙听力测试”的故事。
● 从多个角度验证,避免出现错误结论。

4.4 编写失效分析报告
根据失效分析获得的各种数据,可以证实失效机理,找出失效原因,制定防止实效再次发生的措施,并写成失效分析报告,使成果共享。
报告中最重要的是什么?
提供可靠性CHKLIST、CBB和规范?

五、破坏性物理分析(DPA)介绍
DPA (Destructive Physical Analysis )是破坏性物理分析的简称,它是判断电子元器件质量好坏的有效方法。
DPA是对失效分析经验的主要应用。
DPA针对的是来料或良品。
DPA和IQC有本质的区别。 IQC是通过对大批量的来料抽检一定比例的样品,测试参数,以检验出不合格的比例来决定来料是否合格。需要较大比例的样品。
DPA是在成品元器件中随机抽取适当样品进行解剖分析,在物理解剖的各个阶段都应进行系统、合理、详细的检查和分析,仔细查找在设计、工艺制造、结构和
材料等方面存在的质量隐患,无需检验参数。

五、DPA的典型程序
外部目检
金相显微镜检查残余气体分析键合强度
X射线检查 PIND 密封性试验内部目检开封
扫描电镜检查芯片剪切力结构

器件的ESD失效特征
ESD引起半导体器件损伤,使器件立即失效的几率约10%(短路、开路、无功能、参数不符合要求),而90%的器件则是引入潜在性损伤,损伤后电参数仍符合规定要求,但减

弱了器件抗过电应力的能力,在使用现场容易出现早期失效。
静电损伤是一种偶然事件,一般讲是与时间无关的,所以不能通过老练筛选方法加以剔除,相反,在老练过程中,由于器件接地不良,不适当地传递,老练设备不适当地连

接等反而会提高ESD失效的百分比。

器件的ESD模型
器件ESD模型表征了器件的ESD失效机理,遵循器件级的ESD标准。
ESD模型ESD标准及测试方法
HBM
JESD22-A114-B:2000
ESD STM5.1
MIL-STD-883 Method 3015
MIL-STD-750 Method 1020
MIL-PRF-19500
MIL-PRF-38535
MM JESD22-A115-A:1997
ESD STM5.2
CDM JESD22-C101-A:2001
ESD STM5.3.1

器件的ESD模型
HBM:Human Body Model,人体模型该模型表征人体带电接触器件放电,Rb为等效人体电阻,Cb为等效人体电容。

MM:Machine Model,机器模型机器模型的等效电路与人体模型相似 ,但是等效电容(Cb)是200pF,等效电阻为0,机器模型与人体模型的差异较大,实际上机器的储电电容

变化较大,但为了描述的统一,取200pF。由于机器模型放电没有电阻,且储电电容大于人体模型,同等电压对器件的损害,机器模式远大于人体模型。

CDM:Charged Device Model,充电器件模型半导体器件主要采用三种封装型式(金属、陶瓷、塑料)。它们在装配、传递、试验、测试、运输及存贮过程中,由于管壳与其

它绝缘材料(如包装用的塑料袋、传递用的塑料容器等)相互摩擦,就会使管壳带电。器件本身作为电容器的一个极板而存贮电荷。CDM模型就是基于已带电的器件通过管脚
与地接触时,发生对地放电引起器件失效而建立的,器件带电模型如下:

半导体器件ESD失效机理
●半导体器件的静电放电敏感度与器件结构有密切关系。
●集成电路内部的ESD保护电路。常见的CMOS器件内部电应力保护电路单元有:电阻、二极管、MOS管、SCR等。器件内部的电应力保护网
络通常由这几个保护电路单元的一种或者多种组合构成,具体的选择应根据电路参数、工艺类型和版图设计的实际情况而定。

器件的ESD等级
●器件选型时必须关注器件的ESD等级。

静电放电损伤的预防措施
●半导体器件防ESD损伤的主要措施
(1)器件选型认证:选用ESD等级高的器件。
(2)ESD防护设计:PCB布局、端口保护网络等。
(3)现场ESD控制:在生产、测试、试验、运输、保管和使用现场采取有效措施以消除静电的产生和积累。
(4)ESD管理:人员培训,控制体系等。

系统ESD测试及其标准
●IEC61340-5-1 TR2:1998 Electrostatics-Part5-1:Protection of electronic devices from electrostatic phenomena—General requirements.
●IEC6100-4-2:Electromagnetic compatibility (EMC) –Part4-2:Testing and measurement techniques—Electrostatic discharge immunity test.
●ANSI C63.16:Widely used by US manufacturers of white goods,consumer products and telecom.

系统ESD测试及其标准
大多数产品和通用标准一般都要求:
——空气放电测试达到:8kV
——接触放电测试达到:4kV
一些医疗设备要求空气放电8kV和接触放电6kV。

CMOS-IC中寄生可控硅的触发机理
●CMOS-IC存在一种特殊的(也是主要的)失效机理——闩锁效应。所谓闩锁(latch-up)是指CMOS电路中固有的寄生可控硅结构被触发导通,在电源和地之间形成低阻抗大

电流通路的现象。
●出现闩锁失效的现象注意是器件烧坏和发热严重。


●CMOS-IC由NMOS管和PMOS管互补构成。在一块芯片上制作CMOS-IC,为了实现NMOS管和CMOS管的隔离,就必须在N型衬底内加进一个P型区(P阱)或在P型衬底内加进一个N型

区(N阱)。因此CMOS-IC不可避免地构成了PNPN可控硅(SCR)结构,无论是输入保护电路、输出驱动电路,还是内部反相器都存在这种寄生可控硅结构。

闩锁产生的条件和情况
造成闩锁的外部条件:
——I/O端口电压超过VDD或低于VSS
——I/O端口电流足够大
出现闩锁的主要应用情况有:
——I/O端口有瞬变电应力,如ESD、浪涌等
——芯片带电插拔
——电源端口上电时序不正确
——电源端口有上电浪涌

闩锁测试方法
根据:JEDEC的JESD17-1988、JESD78或AECQ100-004-REV-C等标准。测试方法为:
1、I/O管脚测试
正电流:Inorm+100mA or 1.5*Inorm 负电流:-100mA or -0.5*Inorm
2、电源脚测试  1.5*Vmax

驱动器件闩锁指标举例

八、如何和供应商交流失效分析
原则1:提供器件的失效分析是器件供应商的责任。
原则2:器件供应商的失效分析报告必须符合8D规则,提供详细的分析过程、照片、结论和改进措施。
原则3:器件供应商的失效分析报告必须客观、公正、清晰。
原则4:有必要和器件供应商的失效分析人员进行直接的交流。
要点1:需要把上述原则写入器件购买合同中,保证原则的实施。
要点2:掌握失效分析技术是把握上述原则的技术基础,对供应商是一种很好的技术威慑。

九、典型失效分析案例介绍
案例1:大电流导致器件金属融化
某产品在用户现场频频出现损坏,经过对返修单板进行分析,发现大部分返修单板均是某接口器件失效,对器件进行解剖后,在金相显微镜下观察,发现器件是由于EOS导致

内部铝线融化,导致器件失效,该EOS能量较大。进一步分析和该铝条相连的管脚电路应用,发现电路设计应用不当,没有采用保护电路,在用户现场带电插拔产生的电浪涌

导致该器件失效。通过模拟试验再现了失效现象。

解决方法:在用户手册中强调该产品不支持带电插拔。
预防措施:在今后的设计中,考虑用户的使用习惯,增加防护电路设计,对产品进行热插拔设计。
CHKLIST:接口驱动器件要使用支持热插拔等级在2级以上的器件。


案例2:金丝疲劳断裂
某产品在用户现场使用半年以后,返修率惊人,达到30%,对产品进行分析,对主要失效器件进行失效分析,在扫描电镜下发现金属丝疲劳断裂导致器件失效。进一步的原

因分析,发现是该产品的生产加工控制出现了问题,对潮湿敏感器件的管理没有按照J-STD-033A 标准进行,导致受潮器件没有按照规定时间进行高温烘烤,在过回流焊时出

现“爆米花”效应,对器件造成了损伤,降低了可靠性,导致在用户现场器件失效。
解决措施:对用户现场的所有有问题的批次产品进行召回。
预防措施:在生产加工过程中严格进行MSD的管理和控制。
CHKLIST:不得选用MSL在5级以上的器件。

案例3:电迁移导致器件长期可靠性下降
某产品在用户现场使用3年以后,返修率开始出现明显异常,进行失效分析发现,主要是某功率器件内部电迁移引起。该问题属于器件厂家的设计和制造缺陷。
解决措施:和厂家联系,确定有问题的批次,更换有问题批次的器件。
预防措施:对器件可靠性认证体系重新进行设计,减少厂家批次性问题的发生。
CHKLIST:在对IC作DPA分析时,必须做剖面分析,观察内部各金属层之间的钝化层是否存在空洞等缺陷。

器件可靠应用的根本方法:降额
降额方法
目前有多个降额标准,如美军标、JPL、RAC、国军标、各企业自己的标准等,划分的降额等级也不同。
RAC规定了两个等级: Severe、Benign国军标规定了三个等级:Ⅰ、Ⅱ、Ⅲ 有些企业标准只有一级。
各个企业需要根据自己的产品制定自己的降额标准,包括降额等级和降额因子

10.10.1 电容
10.1.1 电容技术和分类
10.1.2 电容失效模式和失效机理
10.1.3 电容可靠应用概述
10.1.4 电容的应用要点
详细附件下载:电子器件失效分析及可靠应用

给TA打赏
共{{data.count}}人
人已打赏
可靠性动态

如何建立CNAS认可实验室与环境试验技术应用研讨会

2012-12-17 16:10:03

可靠性动态

中国航空发动机需破量产可靠性须大提升的大难题

2012-12-18 16:14:41

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索