葉永和
(溫州市質量技術檢測科學研究院/國家鞋類質量監督檢驗中心(溫州),浙江 溫州 325007)
在監督抽查過程中,要對核查總體(即監督總體、監督批產品或產品總體)進行監督時,往往是采用隨機抽樣的方法,并通過樣品的檢驗來做出判定。因此,一些人很自然地把監督抽查判定核查總體正確與否等同于樣品的代表性強弱,認為其代表性越強,抽查判定結果的正確性越高、越準確,反之相反。所以,很多質量監管部門或人員想方設法在抽查過程中提高樣品的代表性工作,這種看似合理的做法實際上是一種變相的刻舟求劍。
根據我國詞典[1]解釋:代表是指顯示同一類的共同特征的人或事物;性是指物質所具有的性能或物質因含有某種成分而產生的性質。因此,代表性可以解釋為該物質能顯示某種同類物質所具備的性質情況。換言之,某物體能反映該物種的性能,我們視它為該物種的代表,而它的性能或特點越接近該物種的性能與特點,其代表性強,反之其代表性弱。比如,某批男式皮鞋的幫底剝離強度均值為160 N/cm、割口裂口長度為8.0 mm、鞋跟結合力為1800 N 等,而某雙男式皮鞋的幫底剝離強度、割口裂口長度以及鞋跟結合力的特性參數值越接近160 N/cm、8.0 mm、1800 N,其代表性越強,越能代表該批男式皮鞋的質量值。又比如,某抽查的樣品合格品率越接近該產品總體的合格品率,我們就稱該樣品的代表性好,否則稱該樣品的代表性差。
在抽查工作中,樣品的代表性主要不是由抽樣工作的正確與否來決定的,也不是看隨機抽樣方法是否到位去判定的,而是由抽查方案與抽查性質以及條件要求所體現出來,這一點大家必須有一個清晰的認識。
抽樣是從產品總體中抽取部分產品的過程,它分為隨機抽樣與非隨機抽樣。根據國家抽樣標準[2]對隨機抽樣的定義:隨機抽樣是“從總體中抽取n 個抽樣單元構成樣本,使n 個抽樣單元每一可能組合都有一個特定被抽到概率的抽樣”,而非隨機抽樣是除隨機抽樣外的其他抽樣總稱。換言之,隨機抽樣只是一種獲取樣品的方法,它主要是保證樣品抽到有一個特定的獲取概率,排除人為的主觀因素,為推演計算提供客觀的概率依據,不存在隨機抽樣的樣品具備代表性之說。因為,在落實隨機抽樣中,產生隨機數的方法有4 種:隨機數表法、隨機數骰子法、偽隨機數發生器法以及撲克牌法等。但是,無論哪一種方法人們都是無法控制,所以獲得的樣品不可能有代表性,反而非隨機抽樣可以保證樣品的代表性。比如,判定抽樣、篩選抽樣等等。
同時,在產品總體中不可能每件產品的特性參數值都一樣,哪怕是同一廠家、同一型號、同一批次、同一材料、按照同一標準生產的產品也不可能完全一樣,它是呈正態分布,以標準差σ的大小來表示產品特性參數值的分散程度。標準差σ 越小,表示產品特性參數值越集中,即相對的具有代表性產品數越多,反之就少,靠隨機抽樣是不可能獲得樣品能代表產品總體的質量情況[3]。也就是說,抽樣獲取的樣品是否具有代表性不是看它是不是隨機抽樣,實際上與該產品總體的標準差σ 有關,標準差σ 越小,隨機抽樣獲得代表性的樣品可能就越多。比如,某批男式皮鞋的外底耐磨性能均值為6 mm,用隨機抽樣是很難抽到外底耐磨性能為6 mm 值的皮鞋,尤其是標準差σ 比較大的產品總體,而采用非隨機抽樣方法——判定抽樣,就比較容易挑選出外底耐磨性能為6 mm 值的皮鞋。
在統計抽查中人們希望從隨機抽樣的樣品中能得到產品總體的特性參數值,而樣品的特性參數值越接近產品總體值越好,最好是相同,以此來代表產品總體特性參數值,許多科學家對此進行探討。瑞士科學家伯努利在研究事件概率的過程中發現,大量隨機現象的平均結果會趨向一個恒定值,因此創立了伯努利大數定理。
從伯努利大數定理[4]公式(1)得知,當某件發生的概率p,與該事件發生次數γ有密切關系,隨著次數n增大,其趨向于該發生的概率p。

式中:p——發生概率;
γ——事件發生次數;
n——發生次數;
ε——大于零的任意數。
比如,把以事件次數n看作是樣品數量,把樣品出現特性參數值的次數視為γ,而抽查產品總體的特性參數值為概率p,根據伯努利大數定理,隨著抽取的樣品數量的增加,樣品的特性參數值(或占比)就接近產品總體的特性參數值(或比例),甚至與產品總體相同。
然而,在一般情況下把樣品的數量大于50 時,所獲得的樣品統計特性參數值就比較接近該產品總體所擁有的特性參數值,或者說這兩者相差很小,即這些樣品的特性參數值能代表該產品總體的特性參數值,其代表性是隨著樣品數量的增多而加強。因此,在統計抽查中,可以從該產品總體中隨機抽樣100 件產品進行檢驗,樣品的特性參數值或合格品率基本上等同于該產品總體的特性參數值或合格品率,樣品數量越多與產品總體值越接近,其代表性越好。換言之,在統計抽查中隨機抽樣得到的樣品能代表被抽查產品總體。
監督抽查是通過樣品不合格的概率來判定核查總體為不合格總體。也就是說,監督抽查是以隨機抽樣獲得的不合格樣品概率來推算核查總體達不到監督抽查(n;L)對應的聲稱質量水平(即事先規定的質量水平)值,判定為不合格,而不是以相同于樣品特性參數值不符合產品標準規定來證明核查總體該特性參數值也不符合,來判定核查總體不合格的。因為,監督抽查的判定方案是根據概率論的小概率事件原理設置的,不是以樣品的代表性強弱來判別的。
根據小概率事件原理[5],在監督抽查中把實際不合格品率(即質量水平)不高于規定不合格品率(即聲稱質量水平),發生的抽查樣本(即樣品的集合)不合格設置的概率很小,一般為5%。如果在一次監督抽查中發生樣本不合格(樣品不合格數d 大于不合格品限定數L,即d>L),說明該核查總體不合格品率大于規定的不合格品率,判為該核查總體不合格。所以,監督抽查判定核查總體不合格不是根據樣品的代表性強弱做出的,而是以樣本出現不合格的概率來判定的。比如,監督抽查2 個樣品,樣本只有三種可能:100%合格;50%合格與100%不合格,這樣的結果能代表核查總體也只有三種質量水平嗎?或者說這2 個樣品的特性參數值能代表核查總體的特性參數值嗎?這顯然是不可能的,也是不正確的。
目前,國家監督抽查標準[6-9]把錯判概率設定為5%(即隨機小概率事件為5%),來設置監督抽查方案(n;L),根據概率論的二項分布公式(2)計算[10]出當核查總體的不合格品率為Pa(p)。

式中:L——不合格品限定數;
d——樣本中的不合格品數;
p——核查總體的實際質量水平;
n——樣本量。
根據公式2,不同監督抽查方案(n;L)與核查總體不合格品率之間的關系,如表1 為L=0 時、表2 為L=1 時所示。

表1 L=0 時樣本數n 與規定不合格品率的關系

表2 L=1 時樣本數n 與規定不合格品率的關系
從表1 得知,當采用監督抽查方案(n;0)時,樣本中只要出現有不合格,按照小概率事件原理可以判定核查總體的合格品率達不到(n;0)對應的聲稱質量水平值,判為不合格,其置信概率為95%。
比如,監督抽查方案(2;0),檢驗發現1 個樣品不合格不是代表核查總體合格品率為50%,而是指合格品率達不到97.5%;2 個都不合格也不能說核查總體合格品率為100%不合格,只是肯定核查總體的不合格品率超過了2.5%。同樣,當采用監督抽查方案(13;1)時,樣本中有2 個或3 個或4 個及以上樣品不合格,同樣可以肯定核查總體的合格品率達不到97.5%,判為不合格,但不代表對應著核查總體的不合格品率為15.4%或23.1%或30.8%及以上,等等。(2;0)抽查方案沒有發現不合格品是不能證明該核查總體已達到97.5%合格品率或100%合格;同理,(13;1)監督抽查沒有出現不合格品,或只發現1 個不合格品也不能說該核查總體的合格品率已達到97.5%或92.3%,只能說本次監督抽查未發現該核查總體為不合格總體,或不否定其聲稱質量水平值。其他監督抽查方案(n;L)也以此類推:樣本不合格就可判定核查總體不合格,這是監督抽查的特點;而樣本合格是不能肯定核查總體合格,這也是監督抽查的特點。
統計抽查的樣品具有代表性,而監督抽查的樣品不具有代表性也并非絕對的。也就是說,隨著樣本數量增加或減少,以及設置條件的改變,樣品的代表性強弱也會隨之發生變化。
比如,在產品總體中隨機抽取500 個樣品,檢驗后發現有1個或2 個或3 個樣品不合格,樣本的不合格品率分別為0.2%或0.4%或0.6%,從統計抽查角度來說檢驗樣品具有代表性,它代表著產品總體的不合格品率分別為0.2%或0.4%或0.6%,它與實際產品總體的不合格品率值非常接近,這種之差是可以接受的。但是,如果在產品總體中隨機抽樣5 個樣品,檢驗后發現有1個或2 個或3 個樣品不合格,樣本的不合格品率分別為20%或40%或60%,從統計抽查的角度來說檢驗樣品還具有代表性嗎,肯定與實際產品總體的不合格品率相差很大,很顯然樣品是不具有代表性。也就是說隨著樣本量的下降,在統計抽查中其代表性是在逐漸減弱,直至消失。
然而,從監督抽查角度來說,在核查總體中隨機抽樣5 個樣品,檢驗后發現有1 個或2 個或3 個樣品不合格,它可以肯定核查總體的合格品率達不到99%,判其為不合格,可不能以樣品具有代表性來說明核查總體的不合格品率分別為20%或40%或60%。但是,如果監督抽查500 個樣品,檢驗后發現有3 個不合格品,樣本的不合格品率0.6%,這時既可以樣品具有代表性來判定核查總體的不合格品率為0.6%,也可以從監督抽查角度肯定核查總體的合格品率達不到99.85%,判其為不合格。所以,樣品的代表性問題看似與樣本數量大小有關,實際上還與由事先設置的條件要求有關。
在隨機抽樣的樣品是不是具備代表性,不是看抽樣工作的開展是否科學、合乎程序以及工作人員抽查是否認真,而是由抽查方案與抽查性質以及條件要求來決定的。在統計抽查中樣品表現出代表性,它是根據概率論的伯努利大數定理來決定樣品代表性的強弱;在監督抽查中樣品是不具備代表性,它是根據概率論的小概率事件原理所設置判定的結果,是以樣品出現的不合格概率大小來推算得到。換言之,統計抽查與監督抽查不是一回事,雖然都是采用隨機抽樣的方式獲取樣品,但是由于其設計理論基礎與條件要求的不同,所賦予樣品的性質是不一樣的,不能把統計抽查的概念簡單地套用到監督抽查之中,否則會造成監督抽查判定方法與工作方向的混亂。這一點各級監管部門要引起高度重視,應認真學習與掌握抽查控制理論,弄清抽查的性質與目的,充分認識在抽查中樣品的特性與作用。