陳 玉,王 煜,戴凌全
(三峽大學 水利與環境學院,湖北 宜昌 443002)
水輪機模型綜合特性曲線反映了水輪機的流量、轉輪轉速、效率及導葉開度等各參數間的非線性關系[1],在水輪機選型、水電站優化運行及計算機仿真過程中,均需要對其進行數值處理來查詢各計算工況點的特征參數[2]。模型綜合特性曲線上的數據來自于水輪機模型能量實驗和汽蝕實驗,而實驗工況有一定的局限性,無法反映出水輪機非實驗工況點的工況數值。因此,需要在由實驗工況結果數據繪制的模型綜合特性曲線的基礎上對水輪機運行區域進行相關參數的數值拓撲。
目前,水輪機模型綜合特性曲線的數值處理主要有插值法和擬合法兩大類。數值插值方法又可分為基于離散點的插值和網格數值插值,前者主要是進行3次樣條插值[3],較線性插值、最鄰近插值及三次多項式插值,3次樣條插值可解決分界面處的導數不連續問題,數據的平滑性最佳,但在輸入數據分布不均或數據點間距過近時將產生錯誤[4]。同時,3次樣條插值是依次對每1條等開度曲線或等效率曲線進行處理,操作量較大;后者包括規則的矩形網格插值及不規則的三角形網格插值[5-6],這種插值方法將綜合特性曲線視作單位流量-單位開度為基準平面,導葉開度或效率為高程的空間曲面,進行類等高線處理,可得到較為準確的結果,但這種處理方法對網格的質量有著較高的要求,網格質量直接影響數據插值結果。非線性擬合方法主要有二元多項式擬合[7]及神經網絡擬合。
二元多項式擬合主要是基于最小二乘法,對各等開度曲線及等效率曲線分別用多項式表示,各參數間的相關關系描述較為準確,但這種方法需要對表達式的階次進行試算,同時由于是對每一條曲線的分別擬合,操作量極大。當前神經網絡的處理方法主要有RBF神經網絡[8]和BP神經網絡[9-11]。這兩種處理方法均能以一種未知的擬合關系準確描述水輪機模型綜合特性曲線,但各有優缺點。RBF神經網絡訓練時間更短,逼近精度較低,易受分散常數的影響,且分散常數的選取沒有具體的方法,只能嘗試選取;而BP神經網絡有著更好的逼近精度,但存在局部極小和訓練時間長等缺陷[12]。
不同的水輪機模型綜合特性曲線數值處理方法可能得到不同的計算結果,各結果間的差別及反映的各參數間相關關系的差異性未知[13-15],從而可能造成水輪機實際運行與預估值間產生較大的差異,嚴重影響水輪機的安全和經濟運行。為比較不同數值處理方法對水輪機模型綜合特性曲線數值處理的準確性和適用性,得到各數值處理方法的適用范圍。考慮到在數據插值處理中,網格插值是基于面的插值,離散點插值是基于線或者點的插值,均是依賴于數據的平滑性,但基于面的插值含括了線的插值且不需要單獨對每條曲線進行處理,其操作更為簡單;同時,在基于網格剖分的面的插值中,考慮到廠家給定各等開度曲線及等效率曲線之間的間隔不一致,采用矩形網格插值在網格剖分過程中必然會出現較差的網格質量,進一步影響插值結果,所以不規則的三角形網格插值可能更為適用;而在非線性擬合的處理中,高階曲面擬合可獲得明確的表達關系式,神經網絡擬合得到的權值閾值矩陣已知,但具體的表達關系未知,二者的處理具有對比分析的意義,而BP神經網絡較RBF神經網絡的操作更為簡單。因此,本文以A858a-36.6水輪機模型綜合特性曲線資料為例,分別進行基于最小二乘法的高階曲面擬合、基于不規則三角形剖分的三維空間曲面插值及BP神經網絡擬合,并以數據處理值與樣本真實值間相對誤差和的大小作為基準,對這3種數值處理的結果進行比較,評判其數值處理精度,探討各方法的適用范圍,研究結果對水輪機模型綜合特性曲線的數值處理有一定的參考價值。
圖1為A858a-36.6型水輪機模型綜合特性曲線模型綜合特性曲線。圖1中包括:(1)等開度曲線,即導葉開度a為常數時,單位流量Q11與單位轉速n11的關系曲線;(2)等效率曲線,即效率η為常數時,單位流量Q11與單位轉速n11的關系曲線;(3)5%出力限制曲線,規定水輪機只能在95%的最大處理范圍以內工作,其余的5%出力作為裕量;(4)運轉區域,即水輪機正常工作區間在綜合特性曲線上的投影區域。

圖1 A858a-36.6型水輪機模型綜合特性曲線(試驗水頭:30m)
通常,廠家提供的水輪機模型綜合特性曲線為圖形資料中給出的單位流量Q11、單位轉速n11、效率η及導葉開度a之間的相互關系。為確定參數Q11-(n11,a)、η-(n11,a)的相關關系,需要先將圖中的曲線處理成一系列的離散點,即為水輪機綜合特性曲線的離散化及數據提取。特性曲線的數據提取有3種方法,即直接離散提取法、正交網絡離散點提取法和非正交網絡離散點提取法[16]。在實際的處理過程中,采用直接離散提取法即可獲得滿足條件的離散點,同時操作也較為簡單。在進行直接離散提取數據的過程中,采用如下方法:將圖像資料導入CAD軟件中,新建圖層繪制出相應各曲線,并外載入AutoLisp語言逐點輸出坐標。依此提取了等開度曲線的88 024組工況離散點及等效率曲線的227 712組工況離散點,基于等效率曲線的數值處理與等開度曲線一致,本文主要以等開度曲線為樣本進行數值處理及比較。
高階曲面擬合法以最小二乘法[17]為理論基礎,通過改變自變量的階次,使得所確定的擬合關系盡可能多地通過原始樣本點。其具體算法如下:
對于等開度曲線的離散點(n11,a,Q11),非線性關系下各參數的階次未知,尋求一高階多項式:
(1)
使得總誤差為最小。

(2)
公式(2)可看作多元函數的極值問題:
(3)
式中:ωi和υi分別為最小二乘法擬合的表達關系式所對應的n11和a項的系數。
單位轉速及導葉開度的階次人為擬定,再代入公式(3)求解各階次對應的參數權值及擬合表達式;然后通過擬合關系反向求解各樣本值對應的數據求解值與真實值間的誤差,比較確定最小誤差所對應的導葉開度及單位轉速的階次,從而得到高階曲面擬合的表達關系式。
基于最小二乘法的高階曲面擬合,以誤差值作為基準進行比較試算,求解得到單位轉速的階次為3次,導葉開度的階次為2次。關系表達式如下:

(4)
式中:p為系數,是一個95%置信區間內的值;Q11為單位流量,L/s;n11為單位轉速,r/min;a為導葉開度,mm。
在XYZ空間內繪出等開度曲線點及擬合的曲面,如圖2所示。由圖2可看出,擬合的曲面基本能通過所有的離散點,且曲面的光滑度較好;同時,該擬合關系下殘差的平方為0.999 3(殘差的平方值在閉區間[0,1]范圍內,越接近于1認為擬合效果越好),可認為該映射關系擬合度較高。

圖2 等開度曲線點及高階擬合曲面
水輪機模型綜合特性曲線中的等開度曲線(Q11,n11,a)及等效率曲線(Q11,n11,η)可看作一系列以開度a或效率η為高程,以(Q11,n11)為基底二維坐標的等高線圖所形成的投影。因此,可以將這種二維的等高線圖還原為三維的空間曲面進行處理。在空間曲面的處理過程中,網格的質量直接決定了曲面的順滑程度,進而影響最終的插值結果。而Delaunay方法網格生成效率高,可以直接推廣到三維問題,能保證水輪機模型綜合特性曲線還原的三維空間曲面較為順滑[18]。
Delaunay方法[19]利用已知點集將已知平面劃分為凸多邊形,保證每個三角形的外接圓內不存在除自身三個角點外的其他點,以期得到等邊的高質量三角形單元。網格的剖分是基于以(Q11,n11)為基底的二維坐標,第三維數據開度的確立基于三次立方插值[20],其基本原理是通過待插值位置周圍最鄰近點的4×4鄰域的16個點的值按照一定比例加權平均得到插值結果。待完成插值后,將三維曲面還原到等高線即可得到插值結果。
對離散后的二維等開度曲線進行三維空間曲面插值,三維空間曲面插值處理結果見圖3。由圖3可看出,網格劃分質量較差,局部甚至出現了網格間隙過大的問題(圖3(a))。然后將三維空間曲面還原成一系列以導葉開度為高程的等高線,并與原始數據進行比較,二者間的差距也較大(圖3(b))。在還原后的等高線圖中,部分等高線處甚至出現了曲線的“回旋”,而這部分錯誤比較大的插值結果也恰好與較差的網格質量相為對應。

圖3 三維空間曲面插值處理結果
由于單位流量與單位轉速的量綱不一致,而忽略這種不一致直接進行網格剖分,將導致網格質量較差,影響插值結果。基于此,考慮對單位流量與單位轉速同時進行去量綱化處理。將等開度曲線導入CAD軟件,如圖4所示,圖4中所示樣本點在等開度曲線中的含義是:導葉開度為16 mm,單位流量為700 L/s,單位轉速為90 rad/s所對應的工況點。轉換到CAD圖中,該點對應以(295.787 6,135,8 405)為基底坐標,等高線高程為16 mm的數值點。此時,單位流量與單位轉速的值均由平面基底坐標所代替,轉換為兩個無量綱的純數值。將等開度曲線在CAD圖中所處的位置坐標命名為“像素坐標”,像素坐標值與曲線工況點數值在插值前后的對應關系,即為二者之間的映射。

圖4 等開度曲線原始坐標映射變換示意圖
對等開度曲線進行坐標轉換,再進行不規則三角形網格剖分及三次立方插值,繪成的等開度像素坐標曲面如圖5(a)所示,與直接用等開度曲線繪成的曲面3(a)相比,進行映射變換后形成的等開度曲面明顯網格質量更好,曲面也更加平滑。然后根據三維空間曲面的特點,將導葉開度視作等高線高程,依據等高線的性質對曲面進行還原,即將等開度曲面再次投影到二維平面,如圖5(b)所示。經過映射變換后的插值結果較圖3(b),曲線與原始數據明顯更加吻合,也證明了這種去量綱化的映射變換的必要性,及三維空間曲面插值法的準確性。

圖5 改進的三維空間曲面插值處理結果
基于大量試算基礎,在進行BP神經網絡[21]的非線性擬合過程中,采用典型的雙輸入(單位轉速n11及導葉開度a)、單輸出(單位流量Q11)的雙層BP神經網絡,水輪機模型綜合特性曲線BP神經網絡數值拓撲結構如圖6所示。由15個神經元組成(圖6)。由于BP神經網絡對各參數較為敏感,訓練之前,為了保證擬合精度,對各參數需要進行歸一化,將各變量轉化為[-1,1]范圍內的同一量綱的數值。神經網絡隱層神經元之間采用標準的log-sigmoid函數進行傳遞:

圖6 水輪機模型綜合特性曲線BP神經網絡數值拓撲結構
(5)
在經過神經網絡的非線性擬合,且確定好權值矩陣及閾值矩陣后,最終的非線性擬合關系可以表示為:
(6)
將離散后的等開度曲線工況點進行歸一化,隨機取其90%樣本容量的離散點為訓練樣本,按上述原理經過BP神經網絡的訓練和擬合,然后以剩下的10%樣本容量點為檢驗樣本,利用擬合好的非線性關系進行樣本檢驗,取“(擬合結果-真實數值)/真實數值”所得到的相對誤差為評判準則,若這種相對誤差較大,則重新擬合,直至滿足精度要求,最終處理結果如圖7所示。由圖7(a)可知,BP神經網絡擬合的樣本與檢驗樣本之間的相對誤差在范圍±0.004內,擬合度較好。基于擬合好的非線性關系,設置樣本點的單位轉速-導葉開度為輸入值,得到擬合的單位流量結果,進一步繪制BP神經網絡擬合后的等開度曲面與原始的等開度曲線。如圖7(b)所示,擬合后的曲面光滑度較好,且基本能通過所有的離散點,擬合度較高。

圖7 BP神經網絡處理結果
對等開度曲線分別進行高階曲面擬合、三維空間曲面擬合及BP神經網絡擬合后,可知這3種方法均適用于水輪機模型綜合特性曲線的數值處理。為比較這3種方法的處理精度,以數值處理值和原始樣本值間的相對誤差的累加值為基準:
(7)
式中:ε為相對誤差的累加值;ri為樣本點的真實值;di為數值方法處理值;n為樣本點的總個數。
對各開度曲線的擬合精度按公式(7)計算得到的結果如表1所示。由表1中數據可以直觀的看出,對比這3種數值處理方法,高階曲面擬合法的相對誤差值最大,其精度也最差,但它在這3種方法中確最為簡單;三維空間曲面插值及BP神經網絡擬合方法均具有較高的精度,其中三維空間曲面插值的相對誤差累加值是最小的,其精度最高。但這兩種方法在處理時均需要對離散數據進行一定工作量的前處理及數值變換,三維空間曲面插值需要對數據進行去量綱化及映射變換,BP神經網絡擬合則需要進行歸一化及反歸一化的數值處理。

表1 水輪機模型綜特性曲線在不同導葉開度下3種數值處理方法的相對誤差比較
高階曲面擬合法具有最差的精度,但這種處理較三維空間曲面插值及BP神經網絡擬合,其明顯的優勢體現在可以求解得到一個已知權值的映射關系,可以粗略地反映出各參數間的相關關系。此外,高階曲面擬合較三維空間曲面插值而言,不需要進行數據的去量綱化處理;較BP神經網絡擬合法而言,不需要進行反復的訓練。其操作時間最短,平均耗時3 s左右,可以在短時間內獲取一個粗略的表達式。
三維空間曲面插值雖然具有最高的精度,但由于構成三維曲面的網格質量直接影響最終的插值結果,因而在使用這種方法時,為了構造出最佳的網格,必須找到某一特定的對應映射關系,將參量轉換為同一量綱下的數值,最后再根據同一映射關系將處理后的數據進行還原操作。因此,三維空間曲面插值更適用于純圖像類型或可視化問題的數據處理。同時,在進行三維空間曲面插值后的等高線處理時,可看到在邊界處(如本算例中的a=6 mm及a=28 mm的等開度曲線),三維空間曲面插值結果并不好(圖5(b))。因此,三維空間曲面插值更適用于邊界條件已知(如已知等開度曲線a=0)時的工況;或者將處理范圍擴大,如本算例中欲獲得a=28 mm時的插值結果,可以再處理a=30 mm時的等開度曲線結果,使a=28 mm時的等開度曲線由邊界條件變為內部條件,以減小誤差。
BP神經網絡擬合較高階曲面時會耗費更多的時間,由于對大容量樣本進行隨機選擇,根據每次選擇的樣本質量的不同,訓練擬合的時長也有所不同,耗時在124~980 s之間不等。同時,為了檢驗BP神經網絡的處理對樣本容量的需求量,用數值提取軟件共提取了等開度曲線上的869組工況離散點(遠小于CAD軟件提取的88 024組工況離散點),進行歸一化-訓練-檢驗-反歸一化,也以相對誤差為檢驗值,當小樣本容量的相對誤差范圍達到±0.004(同大容量樣本時的相對誤差范圍一致)時停止訓練,并用訓練好的關系進行擬合,按公式(7)計算出各等開度曲線對應的相對誤差累加值,計算結果如圖8所示。圖8顯示,大樣本容量下的BP神經網絡擬合精度要明顯高于小樣本容量。因此,BP神經網絡適用于映射關系未知時的數據處理,可作為三維空間曲面插值的一種補充處理,在數據樣本容量越大時其處理精度也越高。

圖8 BP神經網絡擬合不同樣本容量時的相對誤差
(1)高階曲面擬合、三維空間曲面插值及BP神經網絡均可以對水輪機模型綜合特性曲線進行數值處理。高階曲面擬合基于最小二乘法,可以得到具體的映射關系;三維空間曲面插值依托于Delaunay三角網剖分及三次立方插值,然后由等高線的性質還原數據,其精度最高;BP神經網絡則借助于其強大的非線性逼近能力,對權值進行修正,得到準確的擬合關系。
(2)這3種不同的數值處理方法在具體使用中均具有各自的優缺點:高階曲面擬合較三維空間曲面插值及BP神經網絡擬合,具有最差的精度,但其直接對離散值進行擬合,操作最為簡單,處理時間最短;三維空間曲面插值及BP神經網絡擬合均有較高的處理精度,但二者均需要對離散數值進行轉換及處理——三維空間曲面插值需要對離散值進行坐標的映射變換,BP神經網絡則需要進行數據的歸一化;在進行相應的數值處理后,三維空間曲面插值又需要再一次將像素坐標轉換為實際數值,BP神經網絡則需要進行反歸一化處理。同時,三維空間曲面插值的數據處理較BP神經網絡繁瑣,但在得到精細的網格之后,可以直接插值得到準確的結果;而BP神經網絡則需要較長的訓練時間,要經過多次訓練才可以得到一個精度較高的擬合結果。
(3)高階曲面擬合適用于在短時間內粗略地獲得水輪機模型綜合特性曲線的各參數間的相關關系;三維空間曲面插值適用于純圖像類型或可視化問題,且已知邊界處相關關系時的數據處理;BP神經網絡擬合則可作為三維空間曲面插值的補充處理,尤其在樣本容量更多時,其擬合精度也更高。