陳 方,吳鵬飛,劉金濤,3,甘升偉,周川莉
(1.水利部太湖流域管理局水文水資源監測局,江蘇無錫214024;2.河海大學水文水資源學院,江蘇南京210098;3.河海大學水文水資源與水利工程科學國家重點實驗室,江蘇南京210098)
太湖湖西區位于太湖流域上游,是太湖主要的水量來源,而太湖是太湖流域水資源調控中心。因此,湖西區入湖水量不僅與流域防洪關系密切[1],也與流域水資源優化配置關系緊密。由于經濟社會快速發展,土地利用情況改變、河道整治、水資源調度等原因,近年來湖西區入湖水量出現變化[1- 3]。湖西區入湖水量變化也引起了一系列環境問題,例如太湖污染負荷增加,致使太湖富營養化趨勢未能得到有效遏制[4]。因此,在最嚴格的水資源管理制度下,落實湖西區入湖水量控制具有現實意義。
為實現湖西巡測段入湖水量的動態監測,環太湖水量監測工作早在20世紀60年代便得以開展,并在5個水利分區(含湖西區)設置巡測控制線。湖西巡測段存在大量入湖口門,部分口門無法適用傳統的一潮推流法等流量估算方法[5],特別是一些環湖閘門調度變化較大,導致每年的測驗任務繁重[6]。因此,為研究區域入湖水量變化規律,優化測驗口門數目,建立一個簡單高效的入湖水量估算模型是迫切需要解決的問題。
主成分分析是一種針對多變量的統計分析技術,通過降維消除數據的相關性,可以達到簡化數據的目的。由于水文研究中普遍存在影響因子過多的現象,主成分分析方法被廣泛應用于水質、降水、流量等指標的計算和預測過程[7- 9]。本文通過對湖西巡測段入湖口門的相關關系進行研究,運用主成分分析和回歸分析相結合的方法,試圖遴選出參與模型預測的最優口門數目,建立湖西巡測段入湖水量估算的回歸模型,以期為太湖流域的入湖水量控制管理提供理論參考。
湖西區區域集水面積7 896 km2,年平均降水量1 408 mm。根據1986年~2015年間的巡測資料,湖西區多年平均入湖水量為48.45億m3,占太湖總入湖水量的54.9%,是太湖的主要來水區。
湖西入湖巡測段包括陳東港橋段和浯溪橋段2個分段以及大港橋、雅浦橋、龔巷橋、湖山橋等4個單站(見圖1)。陳東港橋段包括烏溪橋至茭瀆橋共14個橋斷面;浯溪橋段包括分水橋至師瀆橋共9個橋斷面。除雅浦橋和龔巷橋位于常州境內外,其余測段、單站均位于無錫境內。

圖1 湖西區主要巡測段及站點分布
研究中,采用主成分分析遴選出代表性口門,建立回歸模型。主成分分析法是為了消除各口門間的相關性,實現主要影響口門的遴選,以得到綜合各所遴選口門信息的主成分變量,再對提取出的主成分使用多元回歸分析建立模型。假設有n年系列的樣本,p個口門的指標數據參與主成分分析,具體計算步驟如下[10- 12]:
(1)原始指標數據標準化。數量級和量綱的差別往往會給不同數據間的計算帶來誤差,因此需要對數據式進行標準化處理。即

(3)第i個主成分的貢獻率為fi,以此計算累計貢獻率F,通過對F進行分析判斷選取主成分的個數。本文中,將F>80%作為主成分個數m的評判標準,則
(2)
(4)使用式(3)求主成分
(3)
式中,eij是ei的第j個分量。
(5)對主成分與考察因變量進行回歸分析。
使用1986年~2015年的統計資料分析湖西區入湖水量變化。湖西區在30 a研究期內的多年平均入湖水量為48.45億m3,其中1986年~2000年的多年平均入湖水量為38.86億m3,2001年~2010年多年平均入湖水量為56.59億m3,2011年~2015年多年平均入湖水量為60.93億m3。結合圖2可以發現,2000年以后的湖西區入湖水量明顯增多,且呈持續上升的趨勢。

圖2 1986年~2015年湖西區入湖水量變化
鑒于早年入湖站點資料有限,同時湖西巡測段各站點間的相關規律可能隨著入湖水量的增加出現變化,本文使用2001年~2015年數據建立入湖水量計算模型。為增加建模樣本的數量,提高代表性,選取2001年~2014年流量數據作為主成分回歸建模的數據基礎,以2015年流量數據驗證模型有效性。由于2015年是太湖流域少有的豐水年,使用當年數據驗證模型能更為可靠地檢驗模型。
湖西區的4個單站對入湖水量貢獻極小,例如2014年4站總入湖水量為1.22億m3,僅占2014年湖西區入湖水量66.03億m3的1.85%。在豐水年的2015年,4站總入湖水量4.83億m3占湖西區入湖水量75.33億m3的6.4%。因此從優化口門數量角度出發,對陳東港橋段和浯溪橋段的23個站點進行遴選后建模估算湖西巡測段入湖水量。
采用主成分分析法研究2001年~2014年入湖水量數據,得到23個主成分的特征值、貢獻率和累計貢獻率。根據計算結果,前3位主成分的貢獻率(分別為38.41%,28.54%,14.00%)累計達到80.95%。研究認為,累計貢獻率超過80%時的主成分可充分代表全部站點信息。因此,確定了3個主成分,能夠最大限度地包含原有23個站點的信息。
計算所選擇的3個主成分的荷載矩陣,保留相關系數絕對值大于0.8的項組成所需主成分因子,選定了由11個站點組成的3個主成分因子。主成分F1的貢獻率最高,是湖西區入湖水量的最主要影響因素。F1的荷載主要集中在陳東港段,包括官瀆橋、雙橋、定跨橋、八房橋和陳東港橋(相關系數為0.878,0.861,0.860,0.858,0.890)。主成分F2由湖山橋站和犢山閘站組成(相關系數為0.804,0.811)。貢獻率排在第三位的主成分F3包括分水橋、浯溪橋、茭瀆橋和社瀆橋4個站點(相關系數為0.897,0.861,0.881,0.870)。
根據以上分析結合式(3)得出3個主成分因子的組成。即
F1=0.295Q官瀆橋+0.29Q雙橋+0.289Q定跨橋+
0.289Q八房橋+0.299Q陳東港橋
(4)
F2=0.134Q湖山橋+0.811Q犢山閘
(5)
F3=0.5Q分水橋+0.48Q浯溪橋+
0.491Q茭瀆橋+0.485Q社瀆橋
(6)
使用選取的3個主成分代替原自變量進行多元回歸分析,得到主成分與因變量的回歸模型
Y=-45.516-3.649F1-1.172F2+10.317F3
(7)
使用2015年30個測次的實測流量數據驗證上節得出的回歸模型并進行合理性分析。表1與圖3對比了實測流量與估算流量。可以看出,絕大多數情況下實測流量與估算流量相對誤差較小,二者擬合度較好,變化趨勢基本一致。
研究對比發現,算得的流量值普遍小于實測值。這是因為2015年是太湖流域的豐水年,實際流量較其他年份大,各站間的流量相關性與正常年份略有不同,所以計算值出現偏差,但誤差仍在允許范圍內;編號27~29的3個測次連續出現相對誤差較大的情況,主要是由于這3個測次發生在年末、水量較小所致。由此可見,本文建立的模型適用性良好,能夠有效地計算湖西區入湖水量。

表1 2015年實測流量與估算流量誤差對比

圖3 2015年湖西區巡測段實測流量與預測流量對比
本研究發現太湖湖西區入湖水量有不斷增加的趨勢,研究其入湖水量與各站點間的相關關系,通過主成分回歸建立了湖西巡測段入湖水量估算模型,消除了原有變量間的共線性,僅保留三個主成分作為自變量。檢驗結果證明,模型在保證計算精度的基礎上實現了湖西巡測段口門數量的優化,達到了降維以簡化算法的目的。因此,使用主成分分析方法優化站點數量、計算入湖水量,可為水資源管理、區域防洪提供一定理論依據。