李玉超
(海南中南標質量科學研究院,海南 海口 570023)
為保證水利水電工程的質量,根據水利部頒發的檢測管理規定對新開工的水利工程和尚未續建工程進行對比檢測,以便校驗工程的施工自檢。具體檢驗項目由質檢單位審定,依法治水,強化水利工程建設的質量監督,確保工程質量具有重要意義[1]。
在進行工程驗收時,要以施工單位自檢為驗收依據,以真實可靠的施工單位自檢成果為前提條件,以此保證檢驗施工單位自檢成果的真實性。在驗收前,要對比檢測試樣,基于數理統計學進行假設檢驗,對施工單位自檢的實驗結果和對比檢測的實驗結果進行統計推斷。其余的試樣則由施工單位自檢,如果檢驗結果可靠,則2個樣本應為同一個總體;若僅容量不同,則兩者之間不存在較大的差異,且具有一致性[2]。隨機樣本具有隨機性,不可能包含總體的全部信息,因此,2個樣本之間必然存在很大的差異,此時需應用假設檢驗方法分析兩者之間存在的差異,確保兩者之間具有可比性,避免受取樣時間分布和原材料變化等影響造成的誤判,在對施工單位自檢進行分析評價時,要判別施工單位自檢成果的真實性和可靠性,實現對水利工程質量的有效監控,否則起不到預期的結果[3]。數理統計學方法科學可靠,能夠對施工單位的自檢成果進行有力的監督。為此,提出基于水利水電工程質量監督數理統計學的假設檢驗應用研究[4]。
傳統的研究方法會產生有偏的參數估計,導致有偏的預測,降低參數估計的有效性[3]。因此,基于數理統計學考慮假設檢驗預測精度的問題,應用LARS算法選擇變量,為闡述方便,定義參數為β,最小乘法估計為
(1)
式中,β—參數;ι—調節參數;n—最小二乘損失函數。根據LARS算法,定義乘法的剖面為最小二乘損失函數,即
(2)
式中,p>0;λ—調節參數;βJ—LARS估計值;J是一個正則化的問題,利用LARS算法進行求解[5]。

定義:當n→∞,λnn-1/2→0,β0=(β10,…,βp0)要滿足漸近正態性和稀疏性[6]。

(3)
式中,調節參數λ的選擇取決于系數,否則會發生同時選取p個λ的問題,造成計算搜索上的困難。需要注意的是,公式(2)中目標函數Q(β)在原點是奇異的,這給求解最小化造成一定的困難,為了解決這個問題,利用局部二次近似方法進行求解,具體求解過程如下:


表1 缺失情形的變量選擇
通過數值模擬可以調整計算的復雜度,從數值模擬結果可以看出,SCAD方法可以很好地改善估計的擬合精度,與預期的效果一樣[7]。
在選擇完水利水電工程質量監督數值統計學的假設檢驗變量后,要確定假設檢驗顯著性水平,以此確定是否可以接受無效假設的概率標準,記假設水平為α,在假設檢驗應用中,通常取α為0.05或者0.01[8]。
根據小概率事件實際不可能性原理確定是否能夠接受無效假設,通常在假設檢驗的過程中會出現兩類錯誤,詳見表2。

表2 數值統計學假設檢驗的兩類錯誤

另外,需要注意的是,在假設檢驗時選用的顯著水平不要超過0.05,要根據實驗要求和實驗結論選取顯著水平。例如,在實驗中,有許多不可控因素,會導致實驗誤差大,此時,可選擇較低的顯著水平。反之亦然,實驗耗費較大,對精度的要求較高,不能反復進行,實驗結論的應用事關重大,此時,要選擇較高的顯著水平,否則會直接影響假設檢驗的結論[4]。
在確定假設檢驗顯著水平后,要考察基于數理統計學的假設檢驗應用問題,用檢驗模型考慮懲罰函數的影響,檢驗模型為
(4)
式中,ηi—測量誤差,均值為0;Yi和wi—假定序列;εi—核函數[10]。
應用檢驗模型進行參數檢驗,具體步驟如下:
步驟一:假設wi和Yi來自檢驗模型的一組樣本,則
(5)
式中,β—給定的參數;εi—核函數;δi—示性函數。如果Yi可以觀測,則δ=1;若Yi不可以觀測,則δ=0。
在公式(5)中,i是未知函數,依賴于Y和w,需要說明的是,如果w可以精準觀測,則Y服從隨機缺失機制;若w存在測量誤差,計算所得的觀測量則為變量w[11]。
步驟二:在滿足Y和w的缺失機制后,要先獲知參數β的有關先驗信息,這些信息有利于提高參數估計的有效性,假設β滿足如下約束條件:
Aβ=d
(6)
式中,A—已知的k×p矩陣,滿足rank(A)=k;d—k的已知向量。
在滿足上述約束條件下,為了模型的可識別性,要保證Y和w獨立,需對其進行進一步討論[12]。
步驟三:對有限樣本的數值表現進行實際數據分析,用數值例子評價水利輸電工程質量,假設數據來自以下模型:
(7)
式中,取Zi1~N(1,1),ηi1~N(-2,1),Zi2~N(0,σi2)。
應用公式(7)考察樣本標準差,若MEE值變化小,說明估計對模型誤差具有一定的穩健性;若MEE值變化大,說明得到的估計是相合的[13]。
由此,完成基于水利水電工程質量監督數理統計學的假設檢驗應用研究方法的設計。
為考察基于水利水電工程質量監督數理統計學的假設檢驗應用研究方法設計的合理性和邏輯性,采用數值模擬的方法對本次設計的方法和傳統應用研究方法進行對比實驗,考慮到缺失機制,需對兩種研究方法進行1000次實驗,選擇三種不同的樣本量,即n=50,100,150,假設約束條件為Aβ=d,d=3.5,A=(2,1),顯著水平為0.25,實驗對比結果詳見表3。

表3 缺失情形下的約束估計顯著水平(α=0.25)
通過分析表3的數值結果,得到兩種方法的測量誤差對比結果,如圖1所示。

圖1 兩種方法測量誤差對比結果
由圖1可知,利用本文研究方法得到的測量誤差值較小,無論在哪一種缺失機制下,MEE值變化較大,MEE值會隨著樣本量的增加趨于0,這意味著估計是相合的;而采用傳統的研究方法測量誤差時,MEE值變化較大,這意味著估計存在一定的差異。
綜上所述,本文設計的基于水利水電工程質量監督數理統計學的假設檢驗應用研究方法具有一定的可行性,相比傳統的研究方法更值得推廣使用。
由于傳統方法存在有偏參數估計,會影響測量精度,因此提出基于水利水電工程質量監督數理統計學的假設檢驗應用研究。引入LARS算法選擇變量,來調整計算復雜度,并改善擬合精度;根據小概率事件實際不可能性原理確定是否能夠接受無效假設,基于數理統計學的假設檢驗,通過檢驗模型考慮懲罰函數的影響。實驗結果表明,不同缺失機制下本文方法的測量誤差更小,證明所提方法更有利于水利水電工程的質量監督。由于實驗環境與真實環境具有一定差異,實驗結果會有一定偏差,但是不影響實驗結論,接下來可以進一步研究所提方法的穩定性與安全性,來提高該方法的綜合性能。