韓 冰,張 捷,田二勛
(北京奔馳汽車有限公司,北京 100176)
故障類型和影響分析(FMEA)是FMA(故障類型分析)和FEA(故障影響分析)的組合。用來確定潛在失效模式及對系統的影響,在使用FMEA 方法過程中,首先分析系統中每一個潛在的故障模式,評估其對系統所產生的影響,進而采取相應的預防、改進、優化措施,以持續提高設備可靠性的方法。FMEA 是一個逐步優化,循環改進的過程,可以評估大型復雜設備在服役期間的失效、故障造成風險,實現對根據失效風險等級的評定,進而據此制定有效的設備維護策略。在進行傳統的FMEA應用過程中,在充分識別、分析各功能單元的失效模式后,評定其失效優先級系數(RPN),其定義見式(1)。

式(1)中:S(Severity,失效模式的嚴重程度參數),用于評價失效發生后果嚴重程度;O(Occurrence,失效模式發生可能性參數),體現失效發生次數與運行時間的關系;D(Detection,失效模式可探測度參數),表示失效可被探測或識別的難易程度。3 個參數等級劃分從小到大用常數10 到1 來量化。由式(1)可知,RPN 值是將表示失效模式的嚴重程度、失效發生的可能性,以及失效可探測程度的3 個基本參數相乘后得出的。維護人員可根據RPN 值的大小對失效模式進行危害性評定,并制定相應的維護措施。
而在設備全生命周期服役過程中,隨著時間增加,在磨損、老化、腐蝕、疲勞等因素的作用下,設備的功能單元、組成部件失效可能性發生變化。使用傳統FMEA 方法評估設備功能單元失效概率的參數在全生命周期中為常數,因此無法體現設備失效概率隨時間的變化情況,因此計算得出的RPN 值也是常數,無法體現隨著設備服役期的增長各功能單元失效風險優先級系數的變化規律,其存在一定局限性。設備失效曲線(也叫浴盆曲線)可以完整表現設備在全生命周期內失效概率隨時間的變化規律。基于此對FMEA 方法中失效發生可能性評價標準進行改進,并對沖壓設備各失效模式進行動態評估與分析,可提高FMEA 方法的準確性與合理性。
通過對設備失效進行研究,發現大部分設備失效概率曲線,如圖1 所示。這種失效曲線被叫做浴盆曲線。

圖1 設備失效曲線
從圖1 中可以看出,在設備全生命周期中,設備功能單元或組成部件的失效概率可分為3 個階段,即早期失效期、偶發失效期以及損耗失效期。
(1)早期失效期:此階段為設備調試期,失效概率很高,主要原因為原始設計、零部件材料以及制造過程產生的缺陷。隨著設備調試、改進逐步進行,設備整體的失效概率迅速降低,交付設備,投入使用。
(2)偶發失效期:在此階段設備處于穩定生產,失效概率較低,運行穩定,且失效發生概率基本可視為常數。
(3)損耗失效期:該階段為失效劣化期,工作效率隨時間的延長而急速增加,主要由單元或組件的磨損、疲勞、老化和耗損等原因造成。如果采取相應措施,更換新部件或維修,則可有效控制設備失效風險。
由此可以看出設備失效的概率是隨著設備服役時間的變化而變化的,傳統意義上的FMEA 評估標準中,對O 值的評估在設備全生命周期為常數,無法動態的反應設備各部件的失效概率,也會對RPN 值產生影響,進而采取相應的維護措施也會失去動態性和客觀性,造成設備在全生命周期中的過度維護或欠維護。基于設備全生命周期失效曲線重新定義FMEA 方法中設備失效概率的評估準則,使O 值隨著設備服役年限與維修、更換時間點而變化。這樣可以動態的評估RPN 值,同時也避免了設備的過度維護或欠維護。
設備全生命周期FMEA 方法,以“浴盆曲線”的原理,引入了設備服役年限N 作為變量,定義設備功能部件失效概率O 值為N 的函數。優化了設備失效概率這個參數的評估準。
對于設備功能組件,功能比較單一,本身不存在復雜的關聯系統。因此探究部件失效概率是可以忽略浴盆曲線的早期失效階段。因此失效概率與服役時間的關系可以歸結為階躍函數。在部件安裝后,經歷穩定的失效偶發期時,設備失效概率較低,而功能部件進入到損耗失效期時設備失效概率急劇升高。為了能夠有效預防設備損耗失效期功能部件突然失效造成的緊急停機情況,在FMEA 中對設備失效概率的評估需要提前一年提升O值,這樣RPN 值也對應提升,針對提升的RPN 值可以提前一年對功能部件采取相應措施,控制其失效風險。
在全生命周期的FMEA 評估中,功能部件的使用壽命為M 年,對設備正常維護前提下,在新功能部件使用第M 年對其進行維護或更換。該功能部件的失效概率與設備服役年限的關系,見式(2):

式(2)中:Y 為設備服役年限,Oi為功能部件i 的失效概率,M 為該功能部件的使用壽命。該函數關系如圖2 所示。

圖2 失效概率評估系數與服役時間函數關系
根據FMEA 評估方法中的對RPN 值的定義,如式(1),結合式(2)可以得出。基于全生命周期FEMA 方法中,RPN 值的定義,如式(3)所示。

由圖2 和式(3)可以看出,隨著整體設備的使用時間增加,功能部件在維護更換后,功能部件的狀態要低于原始初裝狀態,失效風險也略有增加,因此每個階躍的數值也會隨著使用年限略有增加,這樣能夠更加準確的反應設備失效概率。
大型沖壓自動生產線生產效率高,沖壓產品質量穩定,在大型汽車制造廠的沖壓車間廣泛應用。而沖壓自動生產線自動化程度高,涉及電氣、機械、液壓、氣動多類功能部件高度集成,設備復雜。為了能夠實時有效分析生產線各功能部件的失效模式,并有效控制失效風險,使用全生命周期FMEA 方法動態、客觀的評估自動化沖壓生產線失效風險。表1 至表3 分別表示使用全生命周期FMEA 方法評估沖壓設備失效模式參數的標準。

表1 FMEA 設備故障嚴重度(S)評價等級標準
由表1 和表2 可以看出,S 代表設備功能單元失效造成后果的嚴重程度,評估標準為發生處理失效所占據的生產的時間以及對下游工藝的影響。D 代表失效的可探測程度,評估標準為失效發生前被檢測、預判出的難易程度,以及失效發生后被識別、查找出的難易程度。這2 個參數都與功能單元、組成部件本身特性有關,都體現人員檢測、處理、恢復故障的能力,在設備本身特性不變,維護人員技能水平不變的情況下,可以用常數評價。
而從表3 中可以看出,設備全生命周期FMEA 方法中評估設備失效概率分為2 個方面,以運行周期“年”為單位,一方面是短周期失效概率與短周期運行時間相關的評估標準,如表3(a),評估等級為常數,從每分鐘發生到每年發生評估等級依次降低。另一方面以運行周期“年”為單位,體現設備運行長周期運行過程中,磨損、腐蝕、老化對設備功能部件造成的失效風險。該失效等級為運行時間(設備使用年限)的函數。另外,根據設備功能部件的失效概率曲線可以將自動沖壓設備的所有功能部件的失效有效壽命分類為3 年、5 年、7 年、10 年,分別對應式(1)中的M=3、M=5、M=7、M=10(如表3)。

表2 FMEA 失效可探測度(D)評價標準

表3a FMEA 失效發生可能性(O)評價標準

表3b FMEA 失效發生可能性(O)評價標準
根據表1 至表3 定義的失效等級評估標準,建立自動沖壓生產線的所有功能部件的FMEA 風險控制體系。由于自動沖壓線系統復雜,因此本文僅以自動沖壓線的壓力機機械傳動功能單元為例,來介紹全生命周期FMEA 方法對其失效風險評估與控制策略。該自動沖壓生產線服役期為9 年,表4 為表示的是壓機的機械傳動功能部件FMEA 風險控制體系。

表4 壓機的機械傳動功能部件FMEA 風險控制體系
表4 中“Occurrence”一列為設備失效概率,Y3、Y5、Y10 分別對應功能部件的失效有效壽命分類為3 年、5 年、10 年。該列所對應的數值是根據表3(b)中的函數自動得出,帶入式(1),直接與“Severity”和“Detection”2 個參數相乘得出RPN 值。例如,表4 中第4 行,壓力機上橫梁機械傳動單元中由于軸承磨損導致的驅動力不足(壓力機報警檢測角度超差)這個失效模式中。軸承壽命定義為10 年,目前設備運行時間為9 年,即,M=10,Y=9,根據表3(b)可以得出,該失效模式的O 值為5,因此該失效模式對應的RPN 值為225。說明在設備使用過程中10 年有效壽命的軸承,在第9 年計算得出的RPN 值較大,需要采取相應的維護/維修策略,才能保證設備在第10 年運行過程中不會因為軸承過度磨損而發生故障。因此可以看出,比較傳統FMEA方法來看,基于設備全生命周期的FMEA 方法可以動態的評估功能部件的失效概率,進而更精準的采取控制措施。
以設備全生命周期失效特征(浴盆曲線)理論為基礎,優化傳統FMEA 的評估方法。新評估方法針對設備中各功能部件建立RPN 值與設備服役年限的函數關系,能夠在設備服役的全生命周期動態評估個功能部件的失效風險。同時將全生命周期FMEA 方法應用于自動沖壓生產線中,從結果可以看出隨著服役時間的變化,生產線的各功能部件的失效風險評估參數RPN值也發生變化。基于設備全生命周期FMEA 方法能夠動態評估設備各功能部件的失效風險,為設備維護/維修方案提供精益、合理的技術支持,能夠同時避免設備過維護或欠維護,保證設備穩定性的同時降低設備維護成本。