◆俞鐘行/文
《六西格瑪綠帶手冊》[1]第6章對一個全因子設計實例用回歸建模取得最優解。本文提出不同的方法,可以獲得更合理、更精確的答案。
為降低加工的平面度,研究3個因子各2個水平,又設0水平,見表1。
實際做了23+4次試驗,具體方案和結果見表2。
及它們的交互作用AB是顯著的,繼而對這3項回歸建模,得到回歸方程:
Y=-219.412+0.267A+109.625B-0.116250AB(使用未編碼單位的數據)
最后用MINITAB的響應優化器,得因子最佳組合為A=900、B=2.8,預測最佳值y=32.8875。
原例討論說:表1中運行序8的試驗已達到32.3,為什么預測最佳值明顯地比它大?這就還要看運行序4的試驗結果為33.5,這兩次試驗的條件只差一個非顯著因子C(傾角),況且(32.3+33.5)/2=32.9,很接近預測最佳值。
《六西格瑪綠帶手冊》的242頁倒數第4行起有 一段話:“要注意的是:如果一個高階項(交互作用或二次項)是顯著的,則此高階項所包含的主因子也必須包含在模型中。例如,二階交互作用BC項顯著,則B及C這兩個主效應也一定要被包含在模型中,即使表面上看這兩個主效應項本身并不顯著?!边@段話對回歸建模有影響,無以名之,姑且稱其為“金科玉律”。
3因子2水平是很普通的試驗,即使加幾個中心點也如此。原例用MINITAB軟件作分析,其實用excel也可以。原例強調,回歸建模前必須先對因子編碼,即高水平=1,低水平=-1,0水平=0。試以原例最后得到的回歸方程加以說明:其實編碼不是必須的。若以表3所示的excel電子表格,這里因子并未編碼,用excel“數據分析”中“回歸”模塊分析,可得圖1所示結果。圖中最下表的Coefficients這列,就給出該回歸方程的各項系數,與前述相同。而且,《六西格瑪綠帶手冊》第249頁圖中給出原例的S=1.10997、R-Sq=88.11%、R-Sq=83.66%等值,也與圖1最上表相同。在excel中直接以原始數據做回歸分析,顯然是簡捷可靠的,至少省略了從編碼后獲得的回歸方程再返回到原始數據回歸方程的麻煩。

表1 因素水平表

表2 試驗方案和結果

表3 原例最佳方程用excel做回歸分析的界面
對表2可以用excel畫出因素趨勢圖如圖2。
各因子的趨勢圖有顯著的交叉,提示它們之間可能有顯著的交互作用。實際上以表4所示的excel電子表格界面,用“回歸”分析,可以得到擬合很好的回歸方程,而且因子C是顯著的(圖3)。
從圖3的最上表看,諸如S=1.070933、R-Sq=90.3192%、R-Sq=84.7873%等值都比原例好;最下表的4項因子或交互作用的p值也全都小于0.05。

圖1 原例最佳方程的回歸結果(直接用原始數據)

圖2 因素趨勢圖(自左向右為A、B和C)

表4 參考圖2的excel電子表格界面

圖3 由表4所得的回歸結果
若看《六西格瑪綠帶手冊》的246頁所示圖,當對原例3個因子及其2階交互作用進行回歸建模時,標準誤差S=1.23956,故因子C、交互作用BC都不是顯著的。但在圖3所示情況下,標準誤差S降為1.070933,C和BC成為顯著就不足為奇了。
按照“金科玉律”,圖3所得的回歸方程是不可取的。因為此方程里有2階交互作用BC和AB,卻沒有主效應B。更何況從圖2看,B是最強的因子。
有些人認為“金科玉律”來自“效應排序原則”和“效應遺傳原則”。“效應排序原則”(i)為“低階效應應比高階效應更重要”。根據這條,似乎可依邏輯推得:2階交互作用沒有相關的主效應重要,所以既然有2階交互作用,就必須保留相關的主效應,而這就是“金科玉律”所述。但是,這條原則接著解釋:“在因子效應的數目較大而不能全部進行估計時特別有效,這是一個經驗原則”[2]。應當說現在已有豐富的經驗證明,像圖3那樣判斷效應顯著性是合理與可行的,如“六西格瑪管理”(第二版)例7-7就是。
“效應遺傳原則”為“要使一個交互作用是顯著的,至少它的一個親本因子應該是顯著的”[2]。按這個原則看,回歸方程里沒有顯著的主效應不一定不允許,這個原則是針對交互作用項的。而且用生活常識作比喻:肉、菜和蘿卜熬成的湯里肉看不見了,但菜、蘿卜和湯里充滿了肉味,這是可以的吧。
總之,應當認為“金科玉律”的要求并不合理,它會導致回歸建模受到不應有的束縛,影響改進。有的MINITAB專家說明:“MINITAB15以前不能刪除交互作用重要而主效應不重要的主效應項的,從16版本開始就增加了一個選項,由使用者自行決定刪不刪除這樣的主效應項,這一改進帶來了靈活性,方便讀者使用!”還有知情方說明:金科玉律“是在用MINITAB的DOE模型構建時所必須的”,如果“采用GLM(廣義線性模型)做的,當然不受剛才這句話(指金科玉律)的約束了”。因此,我們應當呼吁:讓原例也享受采用GLM(廣義線性模型)的待遇,如“六西格瑪管理”(第二版)例7-7所示,否則就有削足適履之謬。
對圖3最下表獲得的回歸方程y=74.325+0.258058A+1.301116 BC-3.48915C-0.11281AB,用excel的“規劃求解”選優,得到最佳組合為A=900、B=2.4、C=84,即表2中運行序8的試驗。此時預測值y=32.12218,比實測值32.3還小些,可視作誤差。
那么這個回歸方程是否真的擬合得很好,除了圖3表明的各項參數外(包括中間表的Significance F=0.001175、殘差占比=8.028286/82.93=9.68%),下面以W檢驗法(又名“夏皮羅-威爾克正態檢驗法”)[3]對它的殘差作檢驗,以增加信心。這個檢驗當8<=n<=50時可以利用,適合本例n=12。表5是殘差計算表,殘差的平均值=1.0445E-12。
這個檢驗是建立在次序觀測值的基礎上,將殘差按升序排列,記為x(1),x(2),…x(n),然后計算:

這里k=n/2=6(n為偶數時),系數ak從文獻[3]查得。S2的計算見表6。

表5 殘差計算

表6 S2的計算表