【摘要】某产品研发阶段在做四角实验的过程中,发现单板在低温下出现反复重启动的问题,经过反复的实验和定位,发现是核电源DC-DC芯片使用的液态电解电容,在低温下,内部液体固化。导致电容ESR降低,进而使DC-DC输出的纹波变大,出现单板反复重启动的问题。
一、问题的提出该产品是一款有线通信设备,CPU为1.0V核电压。在该单板做四角实验过程中,温循实验发现单板有重启问题,现象是:低温实验,会存在重启现象了,多次试验重启故障必现。从这个现象看,单板应该是存在设计缺陷,对低温特别敏感。
二、分析过程根据单板复位的现象,按照时钟、电源顺序排查故障发生时CPU关键信号情况:1、时钟信号该单板主时钟为25MHz,通过外部晶体提供。将时钟信号飞线引出,同时放在温箱中。在低温下,发现该单板复位的时候,时钟信号并未出现异常。这里初步排除了不是晶体的问题。
2、电源其次,考虑是单板上的电源有瞬间跌落的问题,从而导致单板复位。通过用示波器在温箱内监测。主要监测了单板上的3.3V、1.8V、1.5V(DDR3电源)和 1.0V (CPU核电源)。在单板复位信号出现的时候,并没有发现上述电源有过跌落。进一步监测1.8V、1.5V和1.0V电源纹波的时候,发现在低温下,1.0V电源纹波有明显的变大。而且,随着温度继续降低,该纹波会继续增大。当1.0V电源纹波增大到一定程度时候,单板出现复位。通过使用复位信号做触发,监测1.0V的纹波,发现1.0V纹波变大的时候,恰好是复位信号出现的时候,在时序上是可以对准的。
图1 单板复位信号和1.0V纹波信号
图2 单板复位信号和1.0V纹波信号放大进一步测量1.0V纹波随温度变化情况:在环境温度降到<0度时候,1.0V纹波即开始变大;随着温度继续降低,纹波越来越大,直到纹波达到到200MV左右,单板复位。为验证是1.0电源纹波的问题,从1.0V电源的输出电感处,断开了单板上的1.0V DC-DC电源,用外部输入的1.0V电源灌入单板,替代原有的1.0V电源。实验发现,用外部电源后,单板在低温下,没有出现复位问题。对于用外部电源替代原有的1.0V电源,主要区别就是外部电源在温箱外面,不受温度变化影响,电源纹波一直稳定。所以,基本可以确定,主要就是1.0V电源纹波导致的单板复位。针对1.0V电源纹波问题,主要考虑:1、电源环路参数问题,导致在低温下环路不稳定,进而导致纹波增大。2、考虑是电源上用的外围器件,在低温下,器件参数变化,导致输出纹波增大。因为环路参数需要DCDC厂家支持配合验证,这里优先自行排查可能性2。针对这个问题,从芯片手册和收集的资料上看,确实有相关的解释:根据1.0V电源选择的DC-DC芯片的手册上看,输出的电源纹波和输出电容的ESR以及开关频率、电感量L有关,具体如下:
图3 DC-DC输出纹波和输出电容ESR的关系
这里Fs是固定的430K,L 电感选择的是10uH ,输入输出的电压不变,在低温环境下测量DCDC开关频率和电感量L变化,排除这两参数影响。1.0V电源的电路如下:
图4 1.0V电源电路这里选择的输出电容C166 是液态铝电解电容,在电容的手册中,没有提到电容的ESR随温度变化的关系,从查到的资料看,液态铝电解电容的ESR会随温度变化而变化。 通常,为了便于分析电容的ESR,多用下图的简化方式来表示:
图5 电容简化图导致ESR变化两个常见因素是:
1)不良的电气连接;
2)电解溶液的干枯。
图6 液态铝电解电容ESR和温度关系从上面的图中可以看到,电容的ESR随着温度的降低而增加。所以,对于该单板在低温下出现的1.0V电源纹波变大,导致的单板复位问题就可以解释了:在低温下,铝电解电容的电解液凝固,导致电容的ESR增加。根据1.0V电源DC-DC芯片手册上的输出电压纹波公式可以知道,ESR增加,必然导致输出电源的纹波增加,理论计算基本与现象符合。三、解决方法为此,要解决这个问题,关键是在低温下保持输出电容的ESR值和常温保持不变。由于该电容的ESR是由于电解液在低温下凝固而导致的,所以,选择了固态铝电解电容来替换。替换后,单板在低温下正常,不再复位。
四、总结虽然最后的解决方法很简单,但整个定位的过程和解决方法,在以后实验中还是具有一定的借鉴作用。本文阐述的实践方法适用于单板上主要芯片功耗大,负载变化较大的单板;对于单板工作环境温度变化比较大的单板,在大电容选择的时候,可以参考。