陳瑞興,程 琳
(1.中國華電集團(tuán)公司福建分公司,福建福州 350001;2.河海大學(xué)水利水電工程學(xué)院,江蘇南京 210098)
基于PCA和多元控制圖的大壩安全多測點(diǎn)數(shù)據(jù)監(jiān)控方法
陳瑞興1,程 琳2
(1.中國華電集團(tuán)公司福建分公司,福建福州 350001;2.河海大學(xué)水利水電工程學(xué)院,江蘇南京 210098)
針對大壩單測點(diǎn)安全監(jiān)控模型存在的不足,提出了一種基于主成分分析的大壩多測點(diǎn)總體監(jiān)控方法。通過一個(gè)線性投影矩陣,對大壩正常運(yùn)行時(shí)的監(jiān)測數(shù)據(jù)采用主成分分析計(jì)算其主成分,并根據(jù)主成分進(jìn)行數(shù)據(jù)重構(gòu)。這樣,一方面可以消除噪聲的干擾;另一方面通過重構(gòu)的數(shù)據(jù)和實(shí)測數(shù)據(jù)計(jì)算得到平方預(yù)測誤差范數(shù),可以方便地實(shí)現(xiàn)對大壩狀態(tài)的總體監(jiān)控。對于大壩的在線監(jiān)測數(shù)據(jù),采用平方預(yù)測誤差的控制圖和貢獻(xiàn)圖,可以在測值出現(xiàn)異常時(shí)實(shí)現(xiàn)對異常測點(diǎn)的定位和異常原因的推斷。實(shí)例的分析結(jié)果表明提出的大壩多測點(diǎn)監(jiān)控模型具有良好的表現(xiàn)。
主成分分析;SPE控制圖;貢獻(xiàn)圖;棉花灘工程
自從意大利的Faneli和葡萄牙的Rocha[1]等于1955年首次對觀測資料采用統(tǒng)計(jì)回歸的方法進(jìn)行定量分析以來,大量基于不同理論的大壩安全監(jiān)控模型被提出來,如統(tǒng)計(jì)模型、混合模型[2]、神經(jīng)網(wǎng)絡(luò)模型[3]和時(shí)間序列模型[4]等??傮w而言,這些模型的基本思路都是通過一定方法計(jì)算出大壩效應(yīng)量的預(yù)測值并與實(shí)測值比較,以判別大壩的工作狀況,對其進(jìn)行監(jiān)控。但這些模型無一例外的都是單點(diǎn)監(jiān)控模型。在大壩測點(diǎn)較多的情況下,很容易產(chǎn)生虛報(bào)警的問題[4]。此外,監(jiān)測數(shù)據(jù)中存在的噪聲對數(shù)據(jù)的分析帶來了很大的干擾。
最近出現(xiàn)的大壩多測點(diǎn)監(jiān)控模型,很好的解決了以上單測點(diǎn)模型的缺陷。如,文獻(xiàn)[5]和[6]都采用主成分分析(PCA)方法進(jìn)行多測點(diǎn)數(shù)據(jù)的分析;Loh[7]采用自相關(guān)神經(jīng)網(wǎng)絡(luò)(AANN)的“瓶頸層”來提取數(shù)據(jù)的非線性主元,并重構(gòu)環(huán)境變量的效應(yīng),然后采用重構(gòu)的誤差來進(jìn)行安全監(jiān)控。本文在對多測點(diǎn)監(jiān)測數(shù)據(jù)進(jìn)行PCA分析的基礎(chǔ)上,采用多元統(tǒng)計(jì)分析中的控制圖和貢獻(xiàn)圖實(shí)現(xiàn)了多測點(diǎn)數(shù)據(jù)的監(jiān)控和異常數(shù)據(jù)原因的診斷。通過對棉花灘大壩監(jiān)測數(shù)據(jù)的分析,證明本文提出的大壩安全監(jiān)控方法具有一定優(yōu)勢,并可以應(yīng)用于實(shí)際工程中。
設(shè)大壩的某觀測物理量有p個(gè)觀測點(diǎn)x=(x1,x2,…,xp)T。各測點(diǎn)的n個(gè)觀測樣本形成觀測數(shù)據(jù)陣X=(xij)p×n。這p個(gè)測點(diǎn)的觀測值之間常常具有相關(guān)性,這樣就增加了樣本內(nèi)部的復(fù)雜性。為此,需要尋找r個(gè)新變量yj(j=1,2,…,r),使yj滿足:

(2)y=(y1,y2,…,yr)的各個(gè)分量之間相互獨(dú)立。
這一過程便被稱為主成分分析(PCA)。y1,y2,…,yr稱為原多變量監(jiān)測數(shù)據(jù)的主成分。
通過PCA,原來的樣本數(shù)據(jù)通過線性投影矩陣A被投影到一個(gè)r維的超平面上

其中,Y=(yij)r×n是根據(jù)觀測數(shù)計(jì)算得到的主成分?jǐn)?shù)據(jù)。采用以下公式對樣本數(shù)據(jù)的協(xié)方差進(jìn)行估算

其中,xj=(x1j,x2j,…,xpj)T是第j個(gè)時(shí)刻對應(yīng)的各測點(diǎn)觀測樣本,u是樣本的均值向量。這時(shí),投影矩陣A可以通過對協(xié)方差矩陣C進(jìn)行譜分解而得到

其中,S1和U1代表前r個(gè)特征值對應(yīng)的特征值和特征向量。它們代表的是各種環(huán)境變量效應(yīng)對于協(xié)方差矩陣的貢獻(xiàn)。剩余的特征值則對應(yīng)的是環(huán)境變量以外,包括觀測噪聲和壩體結(jié)構(gòu)變化等因素的影響。確定r值時(shí),可以先將p個(gè)特征值按降序排列并繪制圖形。圖形出現(xiàn)第一個(gè)突變點(diǎn)時(shí)的特征值編號(hào)被選定為r。這時(shí)線性投影矩陣為[8]

反過來,通過主成分可以重構(gòu)觀測數(shù)據(jù)

任意時(shí)刻j的重構(gòu)的誤差向量為

對應(yīng)任意觀測時(shí)刻j,定義平方預(yù)測誤差(SPE)范數(shù)

對于任意時(shí)刻的觀測值,均可以按照上式計(jì)算出一個(gè)范數(shù)來定量的反應(yīng)環(huán)境變量以外因素的影響的大小。大壩正常運(yùn)行情況下,SPE范數(shù)應(yīng)該在一定范圍以內(nèi),但當(dāng)壩體結(jié)構(gòu)出現(xiàn)異常或監(jiān)測儀器出現(xiàn)故障時(shí),實(shí)測數(shù)據(jù)的SPE范數(shù)會(huì)超過控制限。
隨機(jī)變量SPE的分布形式直接關(guān)系到其控制限的計(jì)算,一般可以假定SPE服從正態(tài)分布,進(jìn)而可以采用正態(tài)分布函數(shù)來計(jì)算其對應(yīng)的控制限。更為精確的方法是采用Martin&Morris[9]提出的核密度估計(jì)(KDE)方法來計(jì)算SPE的分布形式。KDE方法采用核函數(shù)K(?)(一般采用高斯型函數(shù))來擬合數(shù)據(jù)的分布函數(shù)。對于一維隨機(jī)變量的分布函數(shù),可以采用以下形式來進(jìn)行估計(jì)

其中,n是樣本個(gè)數(shù),h為時(shí)窗寬度,也被稱為光滑參數(shù)或帶寬;K(?)是核函數(shù);xi是第i個(gè)監(jiān)測數(shù)據(jù)。采用上式(9)估算出SPE的概率密度函數(shù)后,便可以計(jì)算其對應(yīng)的控制限。仿照正態(tài)分布控制限的擬定方法擬定的二級(jí)控制限UCL1和UCL2分別是由公式(9)估算得到的SPE的概率密度函數(shù)中對應(yīng)概率為 α1和 α2時(shí)的分位值,一般設(shè)定 α1=0.95和 α2=0.99。
當(dāng)監(jiān)測數(shù)據(jù)發(fā)生異常時(shí),除了能及時(shí)的進(jìn)行報(bào)警,還應(yīng)該對異常的測點(diǎn)進(jìn)行定位以便對異常情況進(jìn)行診斷,及時(shí)發(fā)現(xiàn)大壩的安全隱患并分析出數(shù)據(jù)異常的原因。這可以通過多元統(tǒng)計(jì)過程的貢獻(xiàn)圖來實(shí)現(xiàn)。將觀測時(shí)刻j所對應(yīng)的SPE范數(shù)重新表達(dá)為以下形式[10]

其中,Cspei=(xij-ij)表示在第j個(gè)觀測時(shí)刻,第i個(gè)測點(diǎn)對SPE統(tǒng)計(jì)量的貢獻(xiàn)。對于不同時(shí)刻j=1,2,…,n的監(jiān)測數(shù)據(jù),當(dāng)發(fā)生報(bào)警時(shí),通過報(bào)警時(shí)段內(nèi)Cspe的分布可以推測異常測點(diǎn)的位置。
SPE控制圖的四種典型情況見圖1。圖中情況(c)和情況(d)所對應(yīng)的SPE控制圖均出現(xiàn)了報(bào)警。只是情況(c)中SPE在短時(shí)間超過UCL2后又減小至正常范圍,因此呈現(xiàn)出“V型”的曲線;而情況(d)所對應(yīng)的SPE曲線則出現(xiàn)了趨勢性的增長。

圖1 SPE控制圖的四種基本情況
貢獻(xiàn)圖有兩種基本的模式,見圖2。其中,模式Ⅰ中各測點(diǎn)對應(yīng)的SPE分量Cspe分布比較均勻,模式Ⅱ中個(gè)別測點(diǎn)的SPE分量Cspe明顯高于其它測點(diǎn),有明顯的峰值。

圖2 貢獻(xiàn)圖兩種基本模式
將觀測數(shù)據(jù)的SPE控制圖的四種情況和貢獻(xiàn)圖兩種模式進(jìn)行組合便可以得到表1所示的六種組合情況Case 1~Case 6。當(dāng)可以排除人為因素等引起的誤測時(shí),可以根據(jù)實(shí)測數(shù)據(jù)的SPE控制圖和貢獻(xiàn)圖的組合情況,來對監(jiān)測項(xiàng)目的狀態(tài)進(jìn)行定性的評(píng)估。

表1 依據(jù)SPE控制圖和貢獻(xiàn)圖的可能組合
Case 1:監(jiān)測數(shù)據(jù)正常;
Case 2:監(jiān)測數(shù)據(jù)基本正常,但需要跟蹤監(jiān)測一兩次;
Case 3:監(jiān)測數(shù)據(jù)短時(shí)異常,貢獻(xiàn)圖是模式Ⅰ,可能是環(huán)境量出現(xiàn)了歷史極端情況;
Case 4:監(jiān)測數(shù)據(jù)短時(shí)異常,貢獻(xiàn)圖是模式Ⅱ,可能是個(gè)別儀器出現(xiàn)故障,后又恢復(fù)正常;
Case 5:監(jiān)測數(shù)據(jù)異常,并且SPE出現(xiàn)了趨勢性增長,貢獻(xiàn)圖是模式Ⅰ,若環(huán)境變量無極端情況出現(xiàn),有可能是壩體結(jié)構(gòu)出現(xiàn)了較大的時(shí)效性變化,應(yīng)引起注意;
Case 6:監(jiān)測數(shù)據(jù)異常,并且SPE出現(xiàn)了趨勢性增長,貢獻(xiàn)圖是模式Ⅱ,可能是因個(gè)別儀器出現(xiàn)故障引起的數(shù)據(jù)異常。
基于PCA和SPE控制圖的大壩多測點(diǎn)安全監(jiān)控的主要步驟如下:
(1)選取大壩安全運(yùn)行時(shí)的監(jiān)測數(shù)據(jù)作為參考數(shù)據(jù),參考數(shù)據(jù)要有足夠的代表性,能夠盡可能廣的反映不同環(huán)境變量下的大壩效應(yīng),然后對參考數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理;根據(jù)參考數(shù)據(jù)采用文中提到的方法計(jì)算線性投影矩陣和SPE范數(shù),并采用KDE估算得到的SPE的概率密度函數(shù)以便計(jì)算其控制限UCL1和UCL2;
(2)對新的監(jiān)測數(shù)據(jù)采用參考數(shù)據(jù)的均值和方差進(jìn)行標(biāo)準(zhǔn)化,然后采用以上識(shí)別的線性投影矩陣來計(jì)算數(shù)據(jù)對應(yīng)的SPE范數(shù),并與控制限UCL1和UCL2進(jìn)行對比;
(3)若實(shí)測數(shù)據(jù)的SPE范數(shù)超過了控制限,綜合采用SPE控制圖和貢獻(xiàn)圖進(jìn)行異常測點(diǎn)的定位和異常原因的定性分析。
棉花灘大壩位于中國福建省的汀江干流。大壩采用碾壓混凝土(RCC)重力壩,大壩的平面布置見圖3。大壩壩頂高程179.00 m,水庫的正常蓄水位173.00 m,相應(yīng)的庫容為11.22×108m3,校核洪水位177.80 m。大壩采用引張線來進(jìn)行水平位移的監(jiān)測,采用測壓管來監(jiān)測大壩壩基的揚(yáng)壓力情況,引張線和測壓管的布置見圖4。

圖3 大壩平面布置圖

圖4 引張線和測壓管布置圖
采用12個(gè)引張線測點(diǎn)的數(shù)據(jù)進(jìn)行分析。引張線監(jiān)測數(shù)據(jù)的起止日期為2004年1月1日~2008年3月27日,其中2008年的數(shù)據(jù)作為在線監(jiān)測的數(shù)據(jù),其它為參考數(shù)據(jù)。
對參考數(shù)據(jù)進(jìn)行分析,其特征值譜見圖5(a)。由圖5(a)可以看出,特征值譜的拐點(diǎn)出現(xiàn)在第二個(gè)特征值處,因此僅需要兩個(gè)特征值來解釋環(huán)境變量對監(jiān)測數(shù)據(jù)的影響。圖 5(b)是由參考數(shù)據(jù)采用KDE估算得到的SPE的概率密度函數(shù)。參考數(shù)據(jù)和新觀測數(shù)據(jù)的SPE控制圖見圖6,由圖可以看出大壩水平位移監(jiān)測數(shù)據(jù)未出現(xiàn)異常,監(jiān)測數(shù)據(jù)處于正常范圍。

圖5(a) 特征值譜圖

圖5(b) SPE的分布函數(shù)圖

圖6(a) 參考數(shù)據(jù)圖

圖6(b) 實(shí)測數(shù)據(jù)的SPE控制圖
對位于壩基縱向基礎(chǔ)廊道內(nèi)的16個(gè)揚(yáng)壓力測點(diǎn),采用2006年 3月 1日~2008年 12月 18日的956個(gè)數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)采樣間隔為1天。最后56個(gè)數(shù)據(jù)作為新觀測數(shù)據(jù)。圖7為新監(jiān)測數(shù)據(jù)的SPE控制圖,由圖可以看出,監(jiān)測數(shù)據(jù)的測值出現(xiàn)了報(bào)警,SPE呈現(xiàn)“V型”曲線。根據(jù)貢獻(xiàn)圖8可以看出,在測值出現(xiàn)報(bào)警的時(shí)段內(nèi),Cspe集中分布于第5個(gè)測點(diǎn),屬于Case 4。據(jù)表1推斷,測值異常應(yīng)該是由測壓管UP5在短時(shí)段內(nèi)異常所致。根據(jù)檢查的結(jié)果,測壓管UP5在該時(shí)段內(nèi)出現(xiàn)了測值異常的情況,后經(jīng)過處理又恢復(fù)正常。

圖7 SPE控制圖

圖8 SPE貢獻(xiàn)圖
本文提出的基于PCA技術(shù)的大壩多測點(diǎn)監(jiān)測數(shù)據(jù)分析方法,可以實(shí)現(xiàn)對監(jiān)測數(shù)據(jù)中噪聲干擾的消除。僅通過一個(gè)統(tǒng)計(jì)量SPE就可以實(shí)現(xiàn)對多個(gè)測點(diǎn)的同時(shí)監(jiān)控。當(dāng)測點(diǎn)數(shù)據(jù)出現(xiàn)異常時(shí),根據(jù)多元統(tǒng)計(jì)的貢獻(xiàn)圖還可以實(shí)現(xiàn)異常測點(diǎn)的定位和異常原因的推斷。相比與傳統(tǒng)的單測點(diǎn)監(jiān)控模型,表現(xiàn)出很大的優(yōu)勢,在大壩安全監(jiān)測中具有良好的應(yīng)用前景。
[1]Rocha M.A quantitative method for the interpretation of the resultsof the observationof dams.VI Congress on Large dams[R].Report on Question 21,New York,1958.
[2]吳中如.水工建筑物安全監(jiān)控理論及其應(yīng)用[M].北京:高等教育出版社,2003.
[3]Bonelli S,Royet P.Delayed response analysis of dam monitoring data.In:ICOLD European Symposium,Lisse,2001:91-99.
[4]Kim Y S,Kim B T.Prediction of relative crest settlement of concrete-faced rockfill dams analyzed using an artificial neural network model[J].Computers and Geotechnics,2008,35:313-322.
[5]虞 鴻,吳中如,包騰飛,等.基于主成分的大壩觀測數(shù)據(jù)多效應(yīng)量統(tǒng)計(jì)分析研究[J].中國科學(xué)(技術(shù)科學(xué)),2010,53:1088-1097.
[6]Behrouz A N.Multivariate statistical analysis of monitoring data for concrete dams[D].Canada Montreal:McGill University,2002:97-102.
[7]Loh C H,Weng J H,Chen C H,et al.Feature extraction within the Fei-Tsui Arch Dam under environmental variations[J].Nonlinear Stochastic Dynamics&Control,IUTAM BOOK SERIES,2011,29:45-54.
[8]Deraemaeker A,Reynders E,De Roeck G,et al.Vibration-based structural health monitoring using output-only measurements under changing environment[J].Mechanical Systems and Signal Processing,2008,22:34-56.
[9]Matrtin E B,Morris A J.Non-parametric confidence bounds for process performance monitoring charts[J].Statistic process control charts,1996,6(6):349-358.
[10]Miller P,Swanson R E,Heckler CF.Contributionplots:A missing link in multivariate quality control[J].Applied Mathematics and Computer Science,1998,8(4):775-792.
Multivariate Dam Safety Monitoring Model Based on PCA and Multivariate Control Plot
CHEN Rui-xing1,CHENG Lin2
(1.Fujian Subsidiary of China Huadian Group Corporation,Fuzhou,Fujian350001,China;2.College of Water Conservancy and Hydropower Engineering,Hohai University,Nanjing,Jiangsu210098,China)
In view of the shortcomings of univariate monitoring models,a multivariate dam safety monitoring model based on principal component analysis is proposed in this paper.Using a linear mapping,some principal components of monitoring data of the dam under normal operation condition are obtained,and the data is reconstructed from these principal components.Then the disturbance of the noise on the monitoring data could be removed,and the square prediction error which represents the reconstruction error could be calculated and obtained to monitor the state of dam.For the new monitoring data,the SPE control chart and contribution plot are used to infer the reason for data anomaly qualitatively when the abnormal data is detected.The analysis result on a practical engineering shows the good performance of this model.
principal component analysis(PCA);SPE control chart;contribution plot;Mianhuatan project
TV698.1
A
1672—1144(2012)05—0068—05
2012-02-24
2012-04-20
中國華電集團(tuán)公司科技(創(chuàng)新基金)項(xiàng)目(KJ10-02-22)
陳瑞興(1963—),男(漢族),高級(jí)工程師,主要從事電力生產(chǎn)管理工作。