梁秉中
(中國兵器工業試驗測試研究院,陜西 渭南 714200)
在應用數理統計理論的假設檢驗方法進行火炮射程檢驗的實踐中,往往會因為檢驗統計量的計算結果出乎意料而引發產品方與檢驗方的爭議,甚至常常懷疑假設檢驗方法的科學性。在樣本量較小時,檢驗統計量計算結果數值小,能通過檢驗;當樣本量較大時,檢驗統計量數值大,不能通過檢驗。
對數學期望的檢驗方法,在已知母體均方差時,有如下描述[1-2]:正態母體X,其均方差σ已知。根據子樣(Xi,i=1,…,n)檢驗假設H0:ξ=ξ0,其中,ξ是總體X的數學期望,ξ0是已知常數。作統計量U:
(1)

在假設H0成立的情況下,統計量U為標準正態分布,即U~N(0,1),也就是說U的數值通常處于-1.645~+1.645數值區間(主分布區的事件概率為0.90)。
從母體X進行抽樣,抽樣結果是以數值表述的,而數值總是以某種測量過程獲取的。以測量器具對樣本進行測量并記錄,形成抽樣結果。
測量總是有誤差的。在射程試驗中,測量誤差是客觀存在的,無法消除。誤差的來源有多種途徑,包括刻度分辨率、計量能力、測試條件偏差、操作人員業務素養等環節,都會引起相應的誤差。
在測量中,一方面存在系統誤差Δ,另一方面還存在隨機誤差ε。
對抽樣得到的多個個體進行測量,獲得了抽樣結果Hi(i=1,…,n),其中不僅包含了各個樣本的真值Xi(i=1,…,n),還包含了測量的系統誤差Δ、各次測量的隨機誤差εi(i=1,…,n)。因此測量結果與真值之間存在如下關系:
Hi=Xi+Δ+εi,i=1,…,n。
抽樣結果是包含誤差的抽樣數據Hi,i=1,…,n。
在檢驗計算過程中,實際上通常無法感知誤差的存在,也無法分辨系統誤差和隨機誤差。因此會直接對測量結果進行如式(1)的檢驗計算。這樣,誤差會對統計量的計算結果形成干擾。有些情況下,已知抽樣數據中包含有誤差,為了操作簡便,仍以式(1)進行檢驗。
通常以測量數據計算統計量,而測量數據中包含誤差。在沒有獲得真值的情況下,誤差是無法感知的,通常都習慣性地認為測量值就是真值。因此,以測量值按式(1)計算檢驗統計量,這樣的做法從來都沒有受到過質疑。
在包含系統誤差Δ和隨機誤差εi(i=1,…,n)的情況下,對Hi(i=1,…,n)以式(1)進行計算,可以得到系統誤差及隨機誤差對統計量的干擾規律。
延用統計量的思路,計算Hi(i=1,…,n)的統計量,分析其是否服從標準正態分布。對抽樣測量結果求均值:

(2)
記以Hi(i=1,…,n)求得的統計量為K。統計量的演算過程如下。
系統誤差Δ在每一個抽樣數據中都發揮作用,因此可以提取到均值算式之外。隨機誤差εi(i=1,…,n)在各個抽樣數據中數據大小在變,有正值也有負值,在n值很大時,隨機誤差幾乎可以相互抵消,即
(3)
在n值不是很大的情況下,εi(i=1,…,n)求得的平均值通常不能為0,是一個較小的值,接近于0。為了表現其在統計量中發揮的作用,將其記為εe,即隨機誤差的殘差。

(4)

在數理統計中,以式(1)的方式進行對總體抽樣的統計量計算,并得到U~N(0,1)[3-4]。但是在實際的檢驗操作中,抽樣的結果一定包含有系統誤差和隨機誤差,則實際得到式(4)的統計量計算。
在式(4)中,在假設H0成立的情況下有統計量U~N(0,1)。均方差σ已知,通過針對性的檢查可以獲得系統誤差Δ的實際值。記SΔ為系統誤差干擾檢驗統計量的干擾強度:
(5)
則系統誤差的干擾強度SΔ與樣本量n的平方根成正比。
在假設檢驗的應用中,需要特別關注系統誤差對檢驗統計量的干擾強度,并做相應的計算分析。
在式(4)中,記Sε為隨機誤差的殘差對檢驗統計量的干擾強度:
(6)
當樣本量n較小時,殘差εe的數值可能比較可觀,其作用機理與系統誤差的作用機理相同,采用式(6)計算隨機誤差的殘差對統計量的干擾強度。
隨著樣本量n的增加,殘差εe的絕對值趨向于0。一般來說,n>6即可認為殘差εe趨向于0,這時式(4)中的εe項可以取消以便簡化算式。
某型火炮在某狀態的射程是正態總體X,X~N(15.0,0.12)。通常射程抽樣試驗結果有0.4%左右的系統誤差[5]。本型炮在此狀態的射程抽樣的系統誤差可以達到0.06 km。具體的一次射程試驗情況下,不能得出本次試驗射程的系統誤差值,但是根據射程試驗的技術分析,本射程試驗的系統誤差基本上不會超出0.06 km。
下面以多種樣本量的射程抽樣試驗結果進行統計量計算,觀察統計量K的規律。
取抽樣試驗系統誤差分別為20 km,40 km,60 km,樣本量分別為7,15,25,50,100,900,10 000,分別進行計算。計算結果見表1。本例中有ξ0=15.0 km,σ=0.1 km。

表1 系統誤差對統計量的干擾強度計算表
根據表1,統計量U的值在-0.938~+0.585的范圍內,這樣的統計量計算結果在標準正態分布N(0,1)變量的正常分布區域,符合標準正態分布的規律。利用表1的數據繪制檢驗統計量U結果分布圖,并與標準正態分布函數進行對比,見圖1。

圖1 統計量U與標準正態分布函數的對比
表1中K為存在系統誤差時實際計算的檢驗統計量。當存在20 m系統誤差時,樣本量為7的統計量K=0.358,尚在N(0,1)的變量分布范圍內;當樣本量為100時,受干擾的統計量K=2.479,這已經超出了N(0,1)的正常分布范圍;樣本量更大的情況下,受干擾的統計量都是在N(0,1)的正常分布范圍之外。將Δ=20 m,40 m時不同樣本量下求得的統計量K繪圖,并與標準分布函數進行對比,如圖2所示。

(a)Δ=20 m

(b)Δ=40 m圖2 統計量K與標準正態分布函數的對比
表1中對于存在60 m的系統誤差情況,當樣本量為15時,受干擾的統計量K的值已經達到2.843,這已經超出了N(0,1)的正常分布范圍;樣本量更大時,計算的受干擾的統計量數值都是遠遠超出了N(0,1)的正常分布范圍。
因此,在利用假設檢驗理論進行產品檢驗時,系統誤差對統計量有嚴重的干擾。
射程試驗抽樣的誤差來源比較多,如射角誤差、初速誤差、彈形誤差、彈徑誤差、彈質量誤差、測距誤差、空氣密度誤差、風速誤差、空氣溫度誤差、測時誤差、彈道計算誤差等,這些誤差最終形成了彈道試驗抽樣的系統誤差。射程抽樣試驗形成的系統誤差幅值是比較可觀的,專業論著總結了歷史數據并進行誤差分析,形成的結論是系統誤差到達射程的千分之四左右[5]。射程抽樣的系統誤差比較大,使用假設檢驗進行數學期望檢驗正好揭示了系統誤差對統計量的干擾效果。較大的系統誤差形成了對射程檢驗統計量的嚴重干擾,促使研究者對檢驗方法做深入研究,發現系統誤差所產生的強烈干擾。
射程抽樣的系統誤差大,對射程檢驗的統計量形成了很強的干擾,這在靶場試驗中形成了彈道一致性檢驗的老問題, 即認為彈道一致性檢驗的方法
不合理,實際上其根源在于射程抽樣的系統誤差對檢驗統計量形成了太強的干擾。
在抽樣試驗中,測量的數據都含有系統誤差。系統誤差對檢驗統計量的干擾強度應該在計算檢驗統計量時一并計算,并注意其對檢驗結論的影響。在假設檢驗理論的教學中,統計量的計算也應該引入系統誤差所產生的干擾的相關內容。
在有些情況下,系統誤差產生的干擾嚴重地影響了檢驗統計量的計算結果,使其超出了標準正態分布的正常分布范圍。在這樣的情況下,應該研究改進假設檢驗的判據,使之能適當消除系統誤差項的干擾。