無線通信基站系統(tǒng)在現(xiàn)場應(yīng)用中會受到散熱、灰塵、油煙、濕度、腐蝕等環(huán)境因素的影響,而運營商降低建設(shè)成本和維護(hù)成本的考慮使得設(shè)備工作環(huán)境更加惡化。從實踐角度出發(fā),基于實際部署經(jīng)驗,系統(tǒng)性地分析了上述因素對設(shè)備可靠性的影響,提出綜合設(shè)備設(shè)計和應(yīng)用環(huán)節(jié)統(tǒng)籌考慮以減輕影響的思路,并針對設(shè)備設(shè)計和部署給出了具體建議。
運營商降低TCO,主要包含降低建設(shè)成本(CAPEX)和維護(hù)成本(OPEX)兩方面。為了降低CAPEX,通信設(shè)備尤其是接入網(wǎng)設(shè)備的工作環(huán)境,從機房、空調(diào)方艙等被改變?yōu)榘ㄊ彝夤瘛⑷蹼娋堑馈④噹臁㈣F皮柜等各種復(fù)雜環(huán)境,同時對通信設(shè)備提出了體積小、重量輕、安裝成本低的要求,還要維持設(shè)備本身的低成本;為了降低OPEX,設(shè)備要盡量降低功耗、盡可能地被室外化、工作環(huán)境相對過去高溫化,以節(jié)省電費,同時還要求設(shè)備盡量減少維護(hù),以降低維護(hù)人工的成本。接入網(wǎng)電信設(shè)備從精密、嬌貴的設(shè)備,已經(jīng)變成無所不在的IT 化設(shè)備,甚至工作環(huán)境更為惡劣。簡易機房土坯墻面脫落,設(shè)備工作環(huán)境的惡劣情況如圖1 所示。
圖1 設(shè)備工作環(huán)境惡劣情況
在這個背景之下,電信設(shè)備近年來面臨各種新的環(huán)境適應(yīng)性問題,設(shè)備設(shè)計的一些思路也需要有發(fā)生轉(zhuǎn)變,從遵從標(biāo)準(zhǔn)到理解標(biāo)準(zhǔn),滿足應(yīng)用場景,以適應(yīng)不同的應(yīng)用需求。
對設(shè)備在不同環(huán)境下工作以及設(shè)計約束的研究,傳統(tǒng)上屬于可靠性方面。但是,傳統(tǒng)的可靠性方法,并沒有針對實際工程應(yīng)用給出足夠的指導(dǎo)意見。設(shè)備設(shè)計制造需要對環(huán)境適應(yīng)力的深入理解和把握,以及從系統(tǒng)多個維度上進(jìn)行平衡。
1、研發(fā)過程的可靠性方法
傳統(tǒng)的可靠性增長方法,主要從可靠性預(yù)計和可靠性指標(biāo)分配開始,通過預(yù)算、設(shè)計、控制等過程,保證產(chǎn)品的質(zhì)量[1]。
可靠性預(yù)計基于對器件失效模型的認(rèn)識,通過概率與數(shù)理統(tǒng)計方法,首先對系統(tǒng)建立可靠性數(shù)學(xué)模型,然后評估其平均無故障時間(MTBF)、平均恢復(fù)前時間(MTTR)等指標(biāo)。參照的方法很多來源于美國軍用手冊MIL-HDBK-217。但是,這些方法在實際應(yīng)用中有非常大的局限性,存在估算數(shù)據(jù)不準(zhǔn)確,參考意義不足等諸多問題[2-3]。
有一些人認(rèn)為,這些方法估計不準(zhǔn)確的主要原因是在于手冊制訂時間過早,電子工業(yè)經(jīng)過多年的發(fā)展,手冊不符合實際的情況,有一些通過經(jīng)驗進(jìn)行修正盡量使得估計準(zhǔn)確。但是仍然有很多因素使得估算不能準(zhǔn)確進(jìn)行:一個主要因素是失效模型受到諸多外界因素的影響,故障往往都不是模型中考慮的,多為過應(yīng)力使用、非設(shè)計場景的惡劣環(huán)境等,無法在模型里考慮充分;另外一個主要因素是系統(tǒng)模型異常復(fù)雜,實際的分析不可行。
以目前通信基站系統(tǒng)來看,一個系統(tǒng)中存在若干個單板,有一些故障模式并不能完全用串聯(lián)或者并聯(lián)描述,存在關(guān)聯(lián)性。每個單板中可能存在超過100~200 種、數(shù)千個物料,存在多種失效模式。失效模式、失效模式對應(yīng)的器件范圍,甚至一種失效模式在不同的情況下對系統(tǒng)的影響均不相同。這樣,使得可靠性預(yù)計更加困難,難以有效實施。而且,隨著IT 化和商用貨架產(chǎn)品(COTS)的廣泛使用,可靠性分析對設(shè)計的指導(dǎo)作用更加有限。從設(shè)備設(shè)計和生產(chǎn)實際的經(jīng)驗認(rèn)為,主要的設(shè)備故障和異常往往來自于環(huán)境等外部不可控因素影響,而不是部件自身老化或者偶發(fā)失效,這也使得可靠性預(yù)計的準(zhǔn)確度大大降低。
有一些更激進(jìn)的觀點認(rèn)為,可靠性預(yù)計已經(jīng)變成數(shù)字游戲,對產(chǎn)品的質(zhì)量和設(shè)計沒有指導(dǎo)意義。能夠保證設(shè)計系統(tǒng)可靠的是可靠性增長試驗和失效物理(可靠性篩選和監(jiān)控屬于控制范疇,本文不討論)。
失效物理通過研究某一種因素對部件的影響,分析部件會在何時、何處、何種原因,發(fā)生何種類型的失效。通過研究擴(kuò)散、相變、腐蝕、應(yīng)力、靜電泄放等物理化學(xué)過程對器件的影響,來分析器件可能產(chǎn)生的問題。失效物理的分析為進(jìn)一步的改進(jìn)和增加可靠性提供了很好的基礎(chǔ)(分析的例子如圖2 所示)。
圖2 陶瓷電容橫貫裂紋、芯片ESD損毀形貌
目前可靠性增長試驗中,應(yīng)用較為廣泛的包括四角測試、強加速壽命試驗(HALT)等,還包括鹽霧、灰塵、濕塵、振動、滲漏等。這些試驗有意無意地采用失效物理分析的一些因素,例如HALT 實際上考慮的是高低溫應(yīng)力、高低溫循環(huán)帶來的應(yīng)力、疊加強振動等,來尋找系統(tǒng)設(shè)計的薄弱環(huán)節(jié);鹽霧考慮的是腐蝕的問題;振動主要評估結(jié)構(gòu)在應(yīng)力下的表現(xiàn)。因為設(shè)備壽命遠(yuǎn)遠(yuǎn)長于試驗所能夠接受的周期,在可靠性試驗設(shè)計中,常常也采用加速的方法,加大應(yīng)力(電壓、溫度、濕度、溫變速率等),增加樣本數(shù)量,來評估系統(tǒng)實際工作中的壽命。圖3 就是室內(nèi)無線基站設(shè)備的加強灰塵試驗,評估極端灰塵環(huán)境對設(shè)備連接可靠性和散熱的影響。這些試驗對改進(jìn)設(shè)計、提高實際應(yīng)用的可靠性起到了很大的作用,也是設(shè)計中保證設(shè)計指標(biāo)的必要手段。但是為了控制分析的復(fù)雜度,試驗剖面設(shè)計一般只針對某一類應(yīng)力、機理或者失效模式,和現(xiàn)場應(yīng)用的復(fù)雜環(huán)境有所區(qū)別。
圖3 中興通訊無線接入網(wǎng)設(shè)備的加強 應(yīng)力灰塵試驗
系統(tǒng)設(shè)計上,要綜合考慮可靠性方法、電路設(shè)計方法、結(jié)構(gòu)設(shè)計、環(huán)境設(shè)計方法等,結(jié)合降低CAPEX 和OPEX 的要求,確保設(shè)備的可用性。
2、設(shè)備常面臨的環(huán)境問題
設(shè)備工作的環(huán)境情況非常復(fù)雜。北大西洋公約組織將全球的氣候根據(jù)溫度和濕度作了劃分,作為設(shè)計指導(dǎo)的依據(jù)[4]。溫度和濕度對設(shè)備存在一定的影響,但是設(shè)備的工作和更多的環(huán)境因素、人為操作因素相關(guān)聯(lián)。美國軍用標(biāo)準(zhǔn)MIL-HDBK-338B第7 部分,對環(huán)境因素和對設(shè)備的影響進(jìn)行了一些描述,但是也沒有給出設(shè)計指導(dǎo)意見[5]。
因為環(huán)境對設(shè)備的影響相互關(guān)聯(lián),很難獨立的進(jìn)行分析。本文盡量將關(guān)聯(lián)的因素進(jìn)行歸類,分析對設(shè)備帶來的影響以及設(shè)計應(yīng)用中需要進(jìn)行的考慮。
2.1 散熱及相關(guān)
溫度對設(shè)備有很多方面的影響,與散熱相關(guān)的設(shè)計是設(shè)備最關(guān)注的方向之一,并且和包括灰塵等方向相關(guān)聯(lián)。
從可靠性角度來看,溫度影響著器件內(nèi)粒子的擴(kuò)散速度,過高的溫度會加速遷移的速率,最終導(dǎo)致器件的失效。同時,溫度還會加速腐蝕的進(jìn)行。溫度的晝夜、季節(jié)變化導(dǎo)致設(shè)備各個部件的熱脹冷縮。熱脹冷縮率的不同,對器件封裝、組裝等各個環(huán)節(jié)產(chǎn)生循環(huán)的應(yīng)力。溫度對設(shè)備壽命的影響在可靠性分析中已經(jīng)有很多的研究,一般認(rèn)為,溫度每升高10度,設(shè)備的壽命縮短為原來一半。
從可靠性預(yù)計角度來看,為了延長設(shè)備壽命,應(yīng)該使設(shè)備保持較低的溫升。實際上,為了滿足日益增長的處理復(fù)雜度需要,設(shè)備的集成度持續(xù)提升,設(shè)備比以往要耗散更多的電力。要把這些熱散出去,需要增加設(shè)備的體積,或者增加設(shè)備的風(fēng)流量,增加輔助的散熱設(shè)施。這些措施的采用,直接抬高了CAPEX;降低設(shè)備溫度,還意味著風(fēng)扇/空調(diào)的轉(zhuǎn)速更高,作為運動部件的風(fēng)扇,比電子零部件更容易失效,這也就意味著降低溫度實際使得設(shè)備更容易失效;更大的風(fēng)流量,也意味著防塵網(wǎng)需要更頻繁的清洗,增加了人力維護(hù)成本;更大的風(fēng)流量,還意味著更多的耗電、更大的噪音。作為設(shè)計折中,系統(tǒng)設(shè)計中,比較傾向于讓器件的工作溫度在保證降額的情況下,貼近高溫區(qū),減少散熱帶來的電費增加以及風(fēng)扇磨損、噪音等相關(guān)問題。不但如此,系統(tǒng)設(shè)計中讓設(shè)備工作溫度靠近高溫區(qū),還可以降低設(shè)備內(nèi)濕度。但是,貼近高溫區(qū),也可能使半導(dǎo)體器件漏電導(dǎo)致設(shè)備消耗更多能量,需要平衡各因素進(jìn)行考慮。