◆ 俞鐘行/ 文
騎三輪車比騎獨輪車容易多了,企業應用這三個國標,樣本量太大的難題基本可以化解。
抽樣檢驗是企業質量控制必不可少的重要手段。企業或多或少知道并在應用“計數調整型”的抽檢國標GB/T 2828.1。但在實踐中,正確應用GB/T 2828.1卻有不少難點,如AQL如何確定、隨機抽樣和轉移規則如何實施、判定不合格后如何處置等。造成上述困境的最主要原因,是檢索到的抽樣方案樣本量太大,讓企業承受不起。這個問題不得到重視并加以解決的話,統計抽樣檢驗名存實亡,質量控制名不副實。
應對這一挑戰,企業應了解和應用另兩個重要的抽檢國標:一個是“計量調整型”的GB/T 6378.1,它本來就是和GB/T 2828.1配套的;另一個是計數型“聲稱質量水平”(DQL)評定程序GB/T 2828.4,它的前身只許技術監督部門使用,現在企業也可應用。抽檢國標可免費下
1.產生信任感和責任心

以現已形成的比較完備的抽樣檢驗國家標準體系來講,基本上所有場景下的抽樣檢驗都能解決的。但實際上絕大多數企業只對GB/T 2828.1有所知曉,即使如此也常被樣本量太大“卡脖子”。因此,在實際應用中廣泛存在“兩層皮”現象,讓不少質量工作者對統計抽樣檢驗心存疑慮,這種疑慮甚至波及質量保證體系。但是如果拓寬眼界,正確把握GB/T 2828.1、GB/T 6378.1和GB/T 2828.4三個抽檢國標,則能夠有效實施統計抽樣檢驗,大幅提升質量控制能力,從而產生信任感。“沒有規矩,不成方圓”,這是標準化最基本的概念。只有當廣大的質量工作者親身體驗到抽檢國標這個“規矩”是可以實際應用并確實管用,他們才能在內心深處牢牢樹立責任心。
2.符合承受力
對絕大多數企業來說,通曉所有抽檢國標既不可能,也沒有必要,但扼要且融通地掌握上述三個抽檢國標則是必要和可能的。
首先,三個標準提供的抽樣方案可用于(但不限于)各種產品,標準列出了以下八類:最終產品、零部件和原材料、操作、在制品、庫存品、維修操作、數據或記錄、管理程序。
其次,GB/T 2828.1和GB/T 6378.1分別是GB/T 2828和GB/T 6378兩個抽檢國標系列的頭牌,而且GB/T 6378.1標準中明確,它是“GB/T 2828.1的補充”,在很多方面是一致的。比如都是以5個因素確定抽樣方案的,其中有4個因素相同——批量N、AQL、檢驗水平、嚴格度,唯有1個不同——GB/T 2828.1是選一次或多次抽檢,而GB/T 6378.1是選s或σ法。可以形象地把這兩個標準看作人的左右手,人們往往需要兩只手互相配合才能干好活。很多情況下樣本量過大“卡脖子”,正是沒用GB/T 6378.1這只手。至于GB/T 2828.4標準,盡管可能許多企業聞所未聞,實際上已經在無意識應用,標準本身的篇幅也少很多。以個人經驗判斷,一天的“質量檢驗員”課程,用不到一個小時的時間就能介紹這三個抽檢國標的基本情況,起到拓展認知的作用。三個抽檢國標的基本思維,都可用一條操作特性(OC)曲線加以闡明,見圖1。

圖1 抽樣方案操作特性(OC)曲線
統計抽樣檢驗的思維,不是常人所想的只確定一個質量標準,而是確定兩個質量標準:好標準p0與壞標準p1,如圖1水平軸所示。抽樣檢驗肯定會發生錯判,但達到和優于好標準p0時送檢批以高概率接受,一般是95%以上;降到壞標準p1時送檢批以低概率接受,通常是10%,接受概率以豎直軸所示。對GB/T 2828.1和GB/T 6378.1來說,這個p0就是AQL;對GB/T 2828.4來說,p0就是DQL。當p1與p0距離較近,也就是p1/ p0的值較小時,質量稍許達不到好標準p0,接受概率就迅速下降,操作特性(OC)曲線就比較陡,此時樣本量較大、抽檢方案識別能力較強;反之亦然。GB/T 2828.1和GB/T 6378.1就是用嚴格度的調整(也就是OC曲線的陡與緩)來保證接受批的長期質量為p0。GB/T 2828.4的特點則是p1離p0很遠,OC曲線很平緩,但是在適合使用的場景也能很好地發揮作用。
3.掌握控制力
統計抽樣檢驗不是變戲法,而是科學推斷,克服了不合理的“百分比抽樣法”的缺點,使質量控制更精準、更具確定性。在初中物理課上我們學過:如果在一個電壓V=20V的簡單電路里有個100Ω的電阻,則電路中就有0.2A的電流,因為歐姆定律I=V/R規定了這一切。其實,在連續批的統計抽樣檢驗中,不合格品流也可以同樣控制。對于批量N的送檢批,施以AQL=1.0%的合適抽檢方案,結合相應的轉移規則,則在長期(或多批)接受的送檢批中,不合格品率就為1.0%或以下。有些人把經過抽檢后仍有較多不合格品的情況,歸結為抽樣檢驗必然帶來的不確定性或風險,這種說法并不妥當。比如,按AQL=1.0%的方案接受下來的多批產品中,就不應當含2%的不合格品。這才叫控制力。據2021年4月28日發布的公告,近三年,國家監督抽查的合格率平均不到90%。如果企業基本正確地在用統計抽樣檢驗,怎么可能出現這種狀況!
4.駕馭軟設備
假設供應商有批量為200個的10批產品送檢,生產方檢測設備為2套,共能檢測400個產品,還有80%的產品測不到。即使增添2套設備,仍有60%的產品測不到。若采用GB/T 2828.1這套“軟設備”,抽樣方案為N=200、AQL=4.0%、一般檢查水平II,一次正常條件下的n=32、Ac=3,這樣一共需要檢測320個產品就能達到質量控制的目標,原有的2套設備就夠用了。對檢出的“不合格批”若需要挑檢,費用應由送檢方負擔,抽樣檢驗應保持對送檢方提交合格批的心理壓力。增加檢測硬設備,其成本往往是企業難以承受的,應用抽檢國標的“軟設備”成本則很低,更何況增加硬設備也要增加相應的人力成本。中國每年有大批大學生畢業,他們和農民工相比不見得更能“搬磚”,但掌握這種系統復雜、性能高強的抽檢“軟設備”方面,應有潛在優勢。
例1:設某產品批量N=50,規定AQL=0.10%、檢驗水平II,求其正常檢驗一次抽樣方案。查得樣本量字碼為D。從GB/T 2828.1表2-A中,由D所在行與AQL=0.10%所在列的相交處查得↓,表示應使用箭頭下面的第一個抽樣方案125(0,1),樣本量為125,而不是8。上述所依據的是“同行原則”,其口訣為:“跟著箭頭走,見數就停留,同行是方案,千萬別回頭”。但上述方案的樣本量>批量,故應作全檢,而判定數組保持不變。因此,所求的抽樣方案為50(0,1)。
作為檢索抽樣方案,此例有些難度,但也易學會。困難在于:抽檢不成,仍要全檢,而這與AQL=0.10%定得太低有關。本人在飛利浦照明電子公司工作時,該公司也只是電性AQL=0.25%、機械AQL=4.0%,據說西門子和GE公司類似。但近聞一個不足50人的小廠,只有1名40多歲、初中畢業的專職檢驗工,定的AQL在0.1%~2.5%之間。顯然,這個AQL定得過低。他們不使用GB/T 2828.1要求的轉移規則(覺得太復雜),但又想對質量不均勻的送檢批計算出最佳樣本量。其實,若用標準規定的具有“獎優懲劣”功能的轉移規則,送檢批的質量就會自然而然地變為均勻,穩定在規定的AQL之下。標準本身就給出了正常、加嚴、放寬條件下抽檢應有的不同樣本量,既省心又精準。因此,要深信GB/T 2828.1是性能高強的抽檢“軟設備”,并用心去學習使用。

應用GB/T 6378.1,通常可以比應用GB/T 2828.1減少50%~90%的樣本量。所需要的小樣本正態性檢驗技術,也不難掌握。
15年前,某生產工業縫紉機企業曾在德國專家要求下應用MILSTD-414(即對應的GB/T 6378.1標準),為此成立了一個小組,并配備一臺專機,但結果沒能進行下去。工業縫紉機做好后,要抽檢一個指標“最大線跡長度”。抽檢時要搬起沉重的工業縫紉機縫幾下,記下具體的量值,但他們當時仍采用計數調整型GB/T 2828.1,專家建議改用計量調整型GB/T 6378.1的s法,如下。
例2:檢測項目“最大線跡長度≥3.8mm”、N=200、s-4檢驗水平,作正常檢查, AQL=0.65%。按照GB/T 6378.1表1-A,查得樣本量字碼為D,并從表2-A,查得樣本量n=5,接收常數為k=1.65,實測數據為4.13、4.04、4.12、4.07、4.11。Xbar=4.094、s=0.037815(注:樣本標準差s可用帶函數的計算器或excel的內置函數stdev算得),下質量統計量QL=(Xbar-L)/s=( 4.094-3.8)/0.037815=7.7746>1.65,故接收該批。

表1 W統計量的分子的計算
此例若按GB/T 2828.1抽查,樣本量字碼為E,樣本量為13。但由于“同行原則”,最后抽樣方案為20(0,1)。在AQL、檢驗水平、寬嚴度都不變(即檢驗的可靠性不變)的情況下,此例樣本量減少了75%。
此例樣本數據少于8個,按現行國標不能作正態檢驗,但可以用歷史數據作檢驗。
再舉一個用σ法的例子。
例3:某鋼鑄件的最低屈服點規定為400N/mm2,交驗批的批量為500件。檢驗水平為II,采用正常檢驗,AQL=1.5%。已知σ為21N/mm2。由GB/T 6378.1的表1-A查得樣本字碼為I,由表3-A查得對應AQL=1.5%的樣本量為10、接收常數k=1.70。實測樣本的屈服點為431、417、469、407、452、427、421、476、400、445。經計算獲得x b ar=434.5,下質量統計量QL=(xbar-L)/σ=1.69<1.70,故不接受該批。這里每個樣品都是合格的,但判批不合格,往往讓送檢方很不滿意。但在科學推斷上,這是合理的。判不合格后如何處置,要看評審。
因GB/T 6378.1要求質量特性值x服從正態分布或近似服從正態分布,所以對此例用GB/T 4882-2001“正態性檢驗”中的“無方向檢驗”的“夏皮洛-威爾克檢驗”(也稱為W檢驗法)進行檢驗。要計算有關的W統計量,然后與相應的臨界值作比較。若是大于等于,就不拒絕為正態分布。表1給出了W統計量分子的計算。用W檢驗法給出的5個(樣本數據個數的一半)系數a(k),依次與原數據的“最大-最小”、“次最大-次最小”相乘……,然后求和,再平方,就得到W統計量分子。
W統計量分母=nm2,就是“離差平方和”,可用excel的內置函數devsq算得=5832.5。
所以,W=5566.846/5832.5=0.954。與查到的α=0.05和α=0.01時的臨界值W(10,5%)=0.842、W(10,1%)=0.869相比,都是大于,所以不拒絕正態分布的原假設。
例4:對于罩極電機,有4個檢驗項目,如表2所示。對于絕緣和噪聲,雖然檢測設備也有刻度或顯示數字,但根本看不準,只能區分是否合格,所以視作“計數型”,采用GB/T 2828.1。但用萬用表測電流,轉速計測轉速都可以穩定地得到計量值,就采用GB/T 6378.1。這樣,電流和轉速的抽檢量都從13分別降至3和5,極大地提升了效率。

表2 罩極電機的抽樣檢驗方案
通常一次送來30批(箱)左右的罩極電機,逐批抽檢,如果發現有按抽檢方案判定為不合格品,需要再次抽檢,對送檢方的這種心理壓力是必須的。值得一提的是,GB/T6378.1除了大幅度降低樣本量外,還比GB/T 2828.1獲得更有價值和靈敏的質量信息,有利于改進質量。把這方面信息告訴送貨方,有利于他們分析原因和改進質量。送、檢雙方關系得到改善,罩極電機的質量也可以得到控制和改善。
質量經理在審核和認可了供應商的質量體系和生產過程后,還是要檢測生產線上的一兩批產品。有時對送檢批總共只要也只能檢驗很少的幾個產品,類似的情況往往頗多,這種情況正好適用GB/T 2828.4。GB/T 2828.4是針對總體的,檢索方案只用兩個因素——“聲稱質量水平”DQL(相當于OC曲線里的p0)和LQR水平(LQR 是“極限質量比”,就是OC曲線時的p1/p0)。這兩個因素類似于GB/T 2828.1里的AQL和檢驗水平。

GB/T 2828.4站在相信實體的角度對實體的質量水平進行驗證。如果結論是“否決”,則說明具有強有力的證據證明“聲稱質量水平”DQL是錯誤的。為了避免不恰當使用,標準給出了極限質量比(LQR),這一指標可以告訴使用者在使用某一方案時,當實體的質量水平下降到LQR時,仍有約10%的可能性不能對聲稱質量水平作出否決的判斷。這一指標決定使用者在引用驗證結論時應該謹慎考慮的程度。
例5:根據GB/T 2828.4表2,假定使用相應于聲稱質量水平DQL為1.0的抽樣方案n=5和L=0。此抽樣方案,當實際質量水平為該DQL的36.91倍(LQR=36.91),即如果實際不合格品百分數為36.91時,判定總體抽檢合格的風險為β=10%。反之,如果實際質量水平已經是該DQL值,即如果實際不合格品百分數為1.0,則錯誤判定總體抽檢不合格的概率為α=4.9%。
例6:某營業部門在管理部門引進的專門培訓以后,開發票作業失誤比例從0.5%減少到期望的0.1%。管理部門決定評價其效果,用DQL為0.1和LQR水平I來檢索抽樣方案。從GB/T 2828.4表3查得:n=315和L=1,即驗證315張發票的樣本。如果發現不正確處理的發票不多于1張,可認為該培訓方案是成功的。仍由表3看到:對于此抽樣方案,當實際質量水平為該DQL的12.3倍,即LQR=12.3、實際不合格品百分數為1.23時,判定該核查總體抽檢合格的風險為β=10%。反之,如果實際質量水平已經是該DQL值,即如果實際不合格品百分數為0.1,則錯誤判定該核查總體抽檢不合格的概率為α=4.0%。