郭佳晟,劉以建
(上海海事大學物流工程學院,上海 201306)
統計過程控制(Statistical Process Control, SPC)作為經典質量控制方法,可以有效地提升產品質量,保障生產過程。但其針對于單變量的局限性,對現代復雜工藝生產過程的應用效果不佳,生產過程中,常常存在多個具有相關關系的質量特性和過程參數,例如零件加工的長度和直徑、化工過程的溫度、壓力等。只對單個變量監控而不考慮變量之間的相關性會導致誤報警率顯著增加,因此需要用多元控制圖進行過程監控。Hotelling在1947年首先提出了基于T2統計量的多元控制圖,用于對包含多個質量特性的生產過程實施統計監控,由此有了多變量統計控制過程(Multivariate Statistical Process Control, MSPC)的研究。相繼有了多元累積和(Multivariate Cumulative Sum, MCUSUM)控制圖以及多元指數加權移動平均(Multivariate Exponentially Weighted Moving Average, MEWMA)控制圖等。
傳統的控制圖可以稱為參數控制圖,即需要對總體分布有簡單假定,例如正態分布。但實際所采集到的信息,可能無法對總體分布作出簡單的假設,例如單邊尺寸線跳動,呈現為指數分布或者 Weibull分布[1]。當實際分布與假定分布有較大偏差時,基于分布的參數監控會受到很大影響,監控效果大大下降。針對上述缺陷的解決方法有數據變換方法和使用非參數統計量兩種思路,即將過程數據通過映射函數轉換成符合正態分布的形式,或使用不依賴于分布的統計量進行監控。用非參數統計量構建的控制圖稱為非參數控制圖。
在過去幾年里,非參數控制圖已經引起了很多關注,文獻[2]針對再制造過程的復雜特性,提出基于Wilcoxon統計量的EWMA控制圖;文獻[3-4]提出次序秩的非參數EWMA聯合控制圖和基于馬爾可夫均值估計量的自適應CUSUM控制圖;文獻[5]采用基于在Logistic分布下尺度參數的漸近局部最優勢檢驗作為統計量,構建了LOG控制圖;文獻[6]考慮同時對分布均值和標準差的監控,提出結合Wilcoxon秩和檢驗和Ansari-Bradley檢驗的非參數控制圖;文獻[7]使用最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)所得到的概率值作為統計量,提出基于LSSVM的多元非參數控制圖;文獻[8]結合漢密爾頓路徑和游程檢驗,提出了基于游程檢驗的多元非參數控制圖;文獻[9]結合多元符號檢驗,提出了非參數EWMA控制圖;文獻[10]將多元擬合優度檢驗與最小生成樹結合,設計了SMMST控制圖。
本文提出了一種結合Wilcoxon秩和檢驗和Ansari-Bradley檢驗的非參數控制圖,使用協方差矩陣構建統計量,實現對多變量過程的監控。
常用的參數檢驗需要對總體分布有一定的估計,在對分布有假設的基礎上進行檢驗分析。但在實際數據分析過程中,可能無法對總體分布作簡單假定,非參數檢驗是不涉及總體分布的參數的檢驗方法,常用秩和作為檢驗統計量。
通過檢驗可以判斷兩分布的參數是否相同,用于描述分布的參數有位置參數、尺度參數、形狀參數等。
位置參數是描述分布集中趨勢的度量,例如均值和中位數。常用的對位置參數的非參數檢驗有Wilcoxon秩和檢驗、游程檢驗等。
尺度參數是描述分布分散程度的參數。常用的對尺度參數的非參數檢驗有Ansari-Bradley檢驗、Levene檢驗等。
假設有樣本集X:
X=[X1,X2,…,Xi,…,Xn]
將X排序后得到Xr:
Xr=[X(1),X(2),…,X(k),…,X(n)]
其中,下標(k)表示Xi在X中的次序秩,即Ri=k,Ri為樣本X的秩統計量。Wilcoxon秩和檢驗是基于秩統計量的檢驗方法,其構建過程如下:
假設有樣本集X和Y:

(1)
其中,X服從分布F1(μ1,σ1),Y服從分布F2(μ2,σ2)。
原假設為H0:μ1=μ2,備擇假設為H1:μ1≠μ2,定義Wilcoxon秩和檢驗統計量[2]為:
(2)
其中,N=m+n。統計量Z的均值和方差[2]為:
假設有樣本集X和Y,如式(1)所示。
原假設為H0:σ1=σ2,備擇假設為H1:σ1≠σ2,定義Ansari-Bradley檢驗統計量[6]為:
(3)
其中,N=m+n。統計量T的均值和方差[6]為:


假設有受控數據樣本集X0和質量樣本X
(4)
其中,X0~F1(μ1,σ1),X~F2(μ2,σ2),Xi是d維向量。對質量樣本X增加擾動δ,觀察統計量Z和T的變化情況。取d=2,δ~N(0,1),混合樣本集的統計量Z和統計量T的變化情況如圖1、圖2所示。

圖1 擾動為δ時統計量的折線圖

圖2 擾動為1.5δ時統計量的折線圖
觀察圖1、圖2可以發現,當X存在擾動時,統計量Z和統計量T的值都有或大或小的漂移。使用樣本協方差矩陣將統計量Z和統計量T結合,使d維向量轉換為單個值[11],將其作為統計量構建多元非參數控制圖,即定義統計量P為:
(5)
其中,Z是Wilcoxon秩和統計量向量,S是協方差矩陣,T是Ansari-Bradley統計量向量。
使用統計量P構建非參數控制圖,記為WAB控制圖。WAB控制圖同時使用了標準化后的Z統計量和T統計量,放大了漂移,實現對過程的監控。設置控制限h,當P>h時,說明質量樣本的分布發生改變,即生產過程失控,發出報警??刂葡辢的詳情將在下面部分給出。
評價控制圖的指標常用平均運行長度(Average Run Length, ARL),ARL分為受控ARL(ARL0)和失控ARL(ARL1)[12]。ARL0指受控狀態下控制圖第一個虛報樣本之前的平均樣本數;ARL1指失控狀態下控制圖發現第一個失控樣本之前的平均樣本數。本文用蒙特卡羅模擬方法[13]獲取控制限h的值,在確定h值時,一般設ARL0=200,計算步驟為:
(1)選取1組受控數據樣本集X0。
(2)給定控制限h的初始值。
(3)生成1000組與X0同分布的樣本集X。
(4)計算運行鏈長RL(從第一個移動窗口到控制圖首次報警的移動窗口個數)
(5)重復過程(3) ~(5)K次。
(6)計算K個RL值的均值。
(7)如果ARL0接近設定值,則h即為選定的控制限。反之則增大或減小h值并重復上述過程。
使用本文提出的WAB控制圖與T2控制圖進行過程失控狀態下的性能比較,性能指標使用ARL1。樣本數據為:
(6)
其中,x·1服從正態分布,x·2服從Weibull分布。模擬真實生產過程先受控后失控的情況,在Xi,i>500處開始加入擾動δ,δ~N(0,1)。依據上文的方法確定控制限h=0.824,選取(m,n)組合為(50,10)。對不同程度的漂移的ARL1如表1所示??刂茍D的虛報情況如表2所示。

表1 不同δ下ARL1的值
從表1可以看出,WAB控制圖有比T2控制圖更高的敏感度,能更快的發現失控情況。在小漂移的情況有明顯有優勢,隨著漂移量的增大,逐漸與T2控制圖性能持平。
從表2可以看出WAB控制圖基本沒有虛報的現象,比T2控制圖有更高的穩定性。

表2 不同δ下誤報樣本的數量
以某工廠汽車發動機缸蓋生產線為例,對提出的WAB控制圖進行應用和驗證。選取6個質量參數進行監控,采取共100組樣本。其樣本數據的數據特征,如表3所示。部分質量參數的直方圖如圖3所示,可以看到存在明顯不符合正態分布的參數。

表3 質量參數取值范圍表

圖3 部分質量參數直方圖
根據前文論述的方法,采用WAB控制圖對樣本數據進行監控,結果如圖4所示,在第60個樣本處統計量超出控制限,觸發報警,而樣本實際在57處存在失控。由此可以表明WAB控制圖的有效性。

圖4 WAB控制圖
當樣本數據不服從多元正態分布時,傳統基于多元正態分布的控制圖實用性不佳,針對這一缺陷,本文提出了WAB控制圖。使用非參數檢驗的方法,使統計量不依賴于過程分布,同時監控位置參數和尺度參數,通過協方差矩陣構建多元非參數控制圖的統計量P。使用蒙特卡羅方法對控制圖進行性能分析,與T2控制圖進行比對。結果顯示,WAB控制圖能明顯減少由于非正態分布所導致的誤報現象,并且可以更快的發現分布漂移,有著更高的靈敏度和準確性。最后,通過汽車發動機缸蓋生產過程中6個質量參數的測試數據對WAB控制圖的性能進行了驗證,結果表明當過程偏移時,WAB控制圖能夠有效檢測出過程偏移。