【后勤保障與裝備管理】
導彈貯存可靠性試驗中右刪失數據的分布選擇方法
劉天放1,吳進煌2,劉海波2,唐培鋒3
(1.海軍航空工程學院 研究生管理大隊,山東 煙臺264001; 2. 91872部隊,北京102442;
3. 91980部隊,山東 煙臺264000)
摘要:針對導彈貯存可靠性試驗中右刪失數據在數據處理時分布未知的問題,提出了一種分布選擇方法。以右刪失數據的PL估計作為數據分布選擇的基準,計算常見分布下的參數估計,得到可靠度函數估計,計算各分布下可靠度函數曲線與PL估計曲線間的擬合距離,選取擬合距離最小的分布作為數據的擬合分布。
關鍵詞:右刪失;參數估計;PL估計;分布類型
收稿日期:2014-08-02
作者簡介:劉天放(1988—),男,碩士研究生,助理工程師,主要從事裝備綜合保障研究。
doi:10.11809/scbgxb2015.01.026
中圖分類號:E927
文章編號:1006-0707(2015)01-0091-04
本文引用格式:劉天放,吳進煌,劉海波,等.導彈貯存可靠性試驗中右刪失數據的分布選擇方法[J].四川兵工學報,2015(1):91-94.
Citationformat:LIUTian-fang,WUJin-huang,LIUHai-bo,etal.ProcessingMethodofRightCensoredDataDistributioninStorageReliabilityTest[J].JournalofSichuanOrdnance,2015(1):91-94.
ProcessingMethodofRightCensoredDataDistribution
inStorageReliabilityTest
LIUTian-fang1, WU Jin-huang2, LIU Hai-bo2, TANG Pei-feng3
(1.GraduateStudents’Brigade,NavalAeronauticalandAstronauticalUniversity,Yantai264001,China;
2.The91872ndTroopsofPLA,Beijing102442,China; 3.The91980thTroopsofPLA,Yantai264000,China)
Abstract:For the right censored data distribution is unknown in data processing, we proposed a distribution method. Took the loss of data PL estimates as the data distribution selecting reference to right censored, we calculated the parameter estimation under common distribution, then got the reliability function estimation, and calculated the distance between the fitting curve of the reliability function curve and PL to estimate the distribution and to select distribution fitting the minimum distance distribution as the data fitting.
Keywords:rightcensored;parameterestimation;PLestimation;distributiontype
導彈貯存可靠性是導彈在規定的條件下和規定的時間內貯存時,保持規定功能的能力[1]。導彈是長期貯存,一次使用的復雜系統,在其壽命周期內的主要狀態是貯存[2],導彈在經過貯存、維修后,其可靠性一般會降低[3],因此要對導彈開展貯存可靠性試驗來驗證各項指標,并對得到的可靠性數據進行分析處理。導彈可靠性試驗通常采用截尾壽命試驗的方法進行,而導彈可靠性數據分布參數研究需要依靠大量的試驗數據分析。
目前在導彈貯存可靠性試驗中用截尾壽命試驗法所得數據以右刪失數據為常見數據類型,使用常用的數據分析方法所包含的信息嚴重不足,完全觀測數據中所使用的分布選擇方法用在右刪失數據處理中會發生偏差,并不適用,針對此類數據的實用處理方法研究較少。本文針對導彈貯存可靠性試驗中的右刪失數據分布選擇方法較少,提出以右刪失數據的PL估計為基準分布曲線估計,從常用的指數、Weibull和正態等常見壽命分布中,選擇與PL估計最接近的參數分布作為數據擬合的分布,為導彈可靠性工程中的數據分布選擇工作提供一種實用方法,為導彈貯存可靠性試驗中的可靠性評估提供技術支持。
1右刪失數據的含義
從一定批量的產品中抽取一些試驗樣品(n個)做試驗。當失效判據明確后,可以得到數據(t,n,r),其中t為貯存年限,n為試驗數,r為失效數。這組數據的特點是:① 成功數(n-r)是在t時刻試驗時的成功數量,而其貯存壽命T(在這n-r中T>t)到底有多長是未知的;② 當r=0,即無失效數據時,其壽命有多長也是未知的[4];③ 一般r≤n,特別當r=n時,截尾壽命試驗就成為完全壽命試驗。所以完全壽命試驗是截尾壽命試驗的一個極端情況。一般說來截尾樣本所含的失效信息總比完全樣本少一些,上述數據屬于統計學中的生存分析。
生存分析理論研究的對象為非負隨機變量T,即根據觀測到的數據進行統計推斷。生存分析的一大特點,就是討論含有刪失(或區間型)數據的情形。生存分析中常見的有3種類型的數據,包括右刪失數據、左刪失數據[5]和區間數據。右刪失數據是生存分析中一種常見的數據類型。在進行觀測試驗或者調查時,產品已經發生故障,故障時間明確知道,屬于完全觀測;如果不知道一個個體的確切壽命,只知道其壽命大于某個值,則稱該個體的壽命是右刪失的[6]。定時截尾試驗是可靠性試驗中常用的試驗方法,是指試驗到指定時間就立即停止試驗。而右刪失數據在定時截尾試驗中出現較為普遍,這時樣本中的失效個數是隨機的。譬如對40個樣品進行壽命試驗,事先指定1 000h是試驗停止時間,那在1 000h內可能失效15個,也可能失效10個,樣品具體壽命不得知,該樣品的壽命所得數據即為右刪失數據。在工程和醫學領域經常出現右刪失數據,比如接受過某種治療的病人的壽命,如果只知道其治療幾年后還健在,則是右刪失數據。右刪失數據也是導彈使用和試驗中常見的一類數據,用定時截尾試驗方法得到的導彈貯存可靠性試驗中的壽命數據通常并不完全,在試驗期間某些故障和缺陷沒有完全暴露出來,也就無法準確地反映導彈貯存可靠性的真實狀態,因此,導彈在貯存可靠性試驗期間各單元元器件所得的右刪失型數據的分析對于準確評估導彈貯存可靠性有十分重要的意義。
2右刪失數據的分布選擇方法
2.1右刪失數據的參數估計方法
右刪失數據每個數據一般包括2個參數,時間和失效標記,類似結構如表1所示。0代表在這個時間點試件失效,而1代表在這個時間點試件右刪失。

表1 右刪失數據結構
在研究對象的分布函數類型完全未知時,生存分析理論針對不同類型的數據有著不同的分析方法,包括壽命表法、PL估計與Turnbull估計。壽命表法需要所分析對象的觀測例數較多并分組[7],這就需要研究的個體在各檢測時刻同時進行檢測,以確定個體在哪個區間中壽終或右刪失,但這與導彈在部隊的實際檢測情況不相符合。Turnbull估計是針對區間型數據提出的估計方法[8]。右刪失數據有幾種重要的估計方法,如Product-Limit估計、Nelson-Alan估計、Pererson估計、Breslow估計等都是近幾年應用較為廣泛的概念,Product-Limit估計最早由Kaplan和Meier提出,因而又叫K-M估計[9]。由于它具有乘積極限的形式,稱為乘積限估計。它在生存分析中的地位與經驗分布函數在經典統計中的地位相仿,并且兩者有相似的漸近性質:相合性、正態性等。模型公式如下
(1)

對右刪失數據估計的方法,除了Product-Limit估計還有很多種,本文使用PL估計作為對右刪失數據的估計方法。
2.2PL估計的理論基礎

3右刪失數據分布選擇的具體步驟
3.1數據類型
右刪失數據分布選擇方法的思路是將待選的分布與PL估計的結果進行對比,從中選取和PL估計相比偏差更小的分布作為最優分布。設右刪失數據對n個同樣產品的壽命進行觀測,得到t1,t2,…,tn,當ti是確切故障,即完全觀測時,令δi=0;當ti為右刪失數據時,令δi=1。可記錄為
(ti,δi),i=1,2,…,n
3.2分布選擇步驟
由于試驗時間的限制和試驗條件的局限,收集到的導彈試驗數據為右刪失數據,得到數據后,首先計算右刪失數據的PL估計,將其作為數據分布的基準,然后計算4種常見分布下的參數估計,進而得到可靠度函數估計,再計算各分布下可靠度函數曲線與PL估計曲線間的擬合距離,選取擬合距離最小的分布作為數據的擬合分布。具體過程如下:
第一步:將右刪失數據(ti,δi)按照ti的值從小到大排列,記為
(t(i),δ(i)),i=1,2,…,n
其中,t(1)≤t(2)≤…≤t(n),當t(i)是確切故障數據時,記δ(i)=0;當t(i)是右刪失數據時,記δ(i)=1。
計算該產品可靠度函數R(t)的PL估計如式(1)。
第二步:利用極大似然估計確定常見壽命分布下的可靠度函數估計。常見壽命分布包括指數分布、Weibull分布、正態分布和對數正態分布等。
指數分布適用于具有恒定的故障率的產品、在損耗前進行定時維修的部件、由隨機高應力所導致的故障部件以及壽命期內出現耗損的部件;正態分布適用于變壓器、燈泡、輪胎磨損等;對數正態分布適用于半導體元器件、金屬疲勞、繞組絕緣等;威布爾分布適用于陀螺、電動機、斷路器、電子管、電位計、液壓傳動裝置、齒輪、材料疲勞等[11],常用壽命分布的密度函數表達式,如表2所示。
極大似然估計通過對樣本的考察,認為待估參數最像是取什么值作為對參數的估計,其出發點是基于以下統計原理:在一次隨機試驗中,某一事件已經發生,比如已經得到某個具體的樣本X1,X2,…,Xn,則必然認為發生該事件的概率最大[12]。利用極大似然估計得出各常用壽命分布的可靠度函數并做出各個分布估計的曲線圖。

表2 指數分布相關性質
第三步:以PL估計曲線與常見分布估計曲線所圍面積對兩曲線間進行數據擬合,計算各分布下可靠度函數曲線與PL估計曲線間的擬合距離,如圖1所示(圖2中折線為PL估計曲線,曲線為常見分布下的可靠度估計曲線),衡量該分布與PL估計間的偏差,選取擬合距離最小的分布作為數據的擬合分布。具體可用公式(2)計算
(2)
第四步:按照第三步,依次計算PL估計曲線與不同常見壽命分布下可靠度估計曲線的擬合距離,選取擬合距離最小的分布作為該右刪失數據的擬合分布。
上述方法以右刪失數據的PL估計為基準,以常見壽命分布下可靠度估計曲線與PL估計的擬合距離為衡量標準進行數據分布選擇,該方法能夠定量反映所選參數分布和右刪失數據的偏差。

圖1 常見分布估計曲線與 PL估計的擬合距離
4算例
某產品的實際貯存壽命記錄,見表3,單位:天。試用上述方法,選擇該數據的分布類型。
在表3中,第一行為失效時間,第二行為右刪失標記,1為右刪失,0為完全壽終。

表3 某產品貯存失效記錄
根據本文方法,繪制該右刪失數據PL估計與常用壽命分布擬合曲線如圖2所示,分別計算PL估計曲線與指數分布、威布爾分布、正態分布和對數正態分布擬合曲線間的面積,分別為:指數分布為1155.8,威布爾分布為340.95,正態分布為220.01,對數正態分布為1 609.1,見表4。從表4和圖2,可以看出,正態分布的擬合效果最好,因此,選擇正態分布作為該產品貯存壽命的擬合分布。

圖2 右刪失數據非參數估計與參數模型的比較

指數威布爾正態對數正態偏差面積1155.8340.95220.011609.1參數估計μ=2711.4a=2512.0b=1.7μ=2175.7σ=1072.5μ=7.5762σ=1.0364
5結束語
本文針對導彈右刪失數據分布未知,缺少有效的參數分布選擇方法的問題,以右刪失數據的PL估計為基準,以常見(備選)分布下可靠度估計曲線與PL估計的擬合距離(擬合偏差)為衡量標準進行數據分布選擇,并列舉實例,從而為可靠性參數的描述提供了量化支持。此選擇方法可以定量反映備選參數分布和右刪失數據的擬合偏差,簡單直觀,操作方便。
參考文獻:
[1]王靜.導彈貯存指標體系研究[J].強度與環境,2012,39(2):58-60.
[2]武文軍,劉軍,唐興誠.防空兵部隊戰術[M].北京:軍事科學出版社,2001.
[3]耿飛,劉雨時.一種基于維修策略的導彈貯存可靠性模型研究[J].裝備制造技術,2009(10):44-45.
[4]李長福,夏建中,黃躍得,等.考慮刪失數據時彈藥貯存可靠性評估方法研究[J].兵工學報,1996,17(4):303-307.
[5]何書元.生存分析中乘積限估計的大樣本性質[J].數學進展,1998,27(6):481-500.
[6]梁薇.右刪失數據與經驗似然方法[D].北京:北京大學,2011.
[7]姜英秀.Turnbull估計的計算方法及其比較[D].延邊:延邊大學,2007.
[8]TurnbullBW.NonparametricEstimationofaSurvivorshipFunctionwithDoublyCensoredData[J].JournaloftheAmericanStatisticalAssociation,1974(69):169-173.
[9]KapalnEL,MeierP.NonparametricEstimationfromIncompleteObservations[J].JournaloftheAmericanStatisticalAssociation,1958(53):457-481.
[10]陳家鼎.生存分析與可靠性[M].北京:北京大學出版社,2005:25-30.
[11]陳輝強,魏鑫,高飛.裝備可靠性數據處理方法[J].四川兵工學報2010(07):35-37.
[12]吳翊,李永樂,胡慶軍.應用數理統計[M].長沙:國防科技大學出版社,1995:33-34.
[13]樊富友,余智超,陳明,等.制導炸彈貯存可靠性分析與探討[J].裝備環境工程,2013,10(4):102-105
(責任編輯周江川)