王海蘭,田 野,趙燕東
(北京林業大學工學院,北京 100083)
喬木莖體含水量的變化是一個隨機序列,樣本值與區域氣候和田間生態環境密切相關。建立喬木莖體含水量的變化模型可以使植物水分的精準灌溉方便可行,有利于生態環境的保護和維持。近年來,許多專家使用不同的方法來測量喬木莖體的含水量,如烘干法、電阻法、介電常數法、TDR法等,但這些方法都存在不同程度的不足[1-4]。與這些方法相比,SWR技術使得喬木莖體含水量的測量變得更加方便可行[5-6]。
計算機技術的發展方便了大量數據的存儲與分析。其中人工神經網絡ANN具有大規模并行、分布式存儲和處理、自組織、自適應和自學習的能力,特別適合于不精確和模糊信息問題的處理。在系統建模方法中使用人工神經網絡的重要優點是,不需要知道輸入輸出間明確的物理關系,只要給定訓練樣本,神經網絡就可以經過大量訓練,達到目標數據。利用簡單非線性函數的若干次復合,可以擬合復雜函數。利用徑向基函數網絡法,對垂柳莖體含水量的日變化數據進行建模,預測垂柳莖體含水量的日變化情況。
在北京林業大學主樓前草坪中選定一顆正常管理、自然環境下生長良好(枝條均勻茂盛,無明顯枯枝,樹冠如傘)的10 a生垂柳為研究對象,樹高約5 m,直徑約40 cm,樹莖桿高約3.5 m。在垂柳干上距地約1.5 m處,沿徑向鉆兩孔(兩孔上下排列,孔深45 mm,孔徑3 mm,孔間距30 mm),并安裝一組SWR探針,為保證探針尖端與植物接觸緊密,最后用鐵錘釘入5 mm,探針外露10 mm。從2008年7月14日開始,利用數據采集器實時測定垂柳莖體水分的變化情況,每小時記錄一次數據。
人工神經網絡ANN包含輸入層、隱含層、輸出層。數據由輸入層輸入,并按一定的權重聯至隱含層;隱含層進行權重的加和,并通過輸出函數的轉換,而后傳輸到輸出層;輸出層給出神經網絡的預測值或模式判別結果。本研究中使用的徑向基函數網絡是一種典型的局部逼近神經網絡,對于輸入空間的某個局部區域,只有少數幾個權值影響網絡的輸出。對于每個輸入輸出數據隊,只有少量的權值需要進行調整,從而使得網絡具有學習速度快的優點。
圖1為具有i個輸入的徑向基神經網絡模型,模型中有由j個徑向基函數神經元組成的隱層和一個具有線性神經元的輸出層。徑向基函數神經元的傳遞函數有各種各樣的形式,但最常用的形式是高斯函數。函數的輸入信號靠近函數的中央范圍時,隱層節點將產生較大的輸出,徑向基函數網絡具有局部逼近的能力。隱含節點的輸出由zj(x)給出,見公式(1)。

圖1 徑向基函數網絡的結構

其中x為輸入向量;μj為隱層節點j的徑向基函數的中心;||x-μj||表示徑向基函數的中心與輸入向量的歐幾里德距離;σj表示控制徑向基函數的平滑度系數。網絡的第三層為與隱含層相連的,含有L個節點的輸出層,為zj(x)的線性加權和,見公式(2)。

其中 yl是第l個輸出層節點,wlj是第j個隱層節點和輸出層的第l個節點間的權值。
在對莖體含水量長期觀測的前提下,可以獲得隨時間變化的含水量數據,通過對這些數據進行擬合,可以建立垂柳莖體含水量的預測模型。為了保證預測模型的準確性,必須考慮到預測的誤差,而在式(1)中,μj反映了已有觀測數據的集中性,可以起到對觀測數據進行分組的作用。||x-μj||反映預測數據與已觀測數據的相近性,而σj控制了擬合時的光滑程度。通過(2)式的調整,既可以避免欠擬合,又可以避免過擬合,使最終的預測誤差控制在合理的范圍。在預測時,輸入為當前時間前的連續觀測的數據,而輸出則為后續時間的預測數據。式(1)、式(2)中的參數,可利用已有的觀測數據進行訓練來確定。所以,RBF可以成為非常合適的數據擬合以及預測喬木莖體水分日變化的模型。
1.3.1 數據準備 本研究中的數據來自于數據采集器,選取2008年8月18日到9月19日共33d的792個數據。研究中把數據分成兩部分,第一部分從8月18日到9月18日共768個數據用來訓練模型,第二部分共24個數據(9月19日)用來驗證模型。
1.3.2 網絡的建立及訓練 本研究中使用徑向基函數法來訓練網絡,用Matlab的神經網絡工具箱來初始化訓練的權值,輸入數據以向量的方式組織。為了確定輸入向量的維數,分別比較了輸入數據是連續的 2、4、5 個(即維數分別是 2、4、5)時的預測值。將觀測數據分別按不同的維數進行分組后,作為訓練數據,送入MATLAB神經網絡工具箱,來確定所有模型參數,然后利用另外一組觀測數據進行測試。
研究中設置預測誤差及光滑系數eg、sc分別為0.1、0.5和 1,通過調整系數,達到網絡結構的最優化。
圖2、圖3、圖4給出了預測誤差與光滑系數eg、sc分別為0.1、0.5和 1時,觀察數據與預測數據之間的關系。各圖首列輸入向量的維數均為2,第二列的維數均為4,第三列的維數均為5。

圖2 當eg=0.1,sc=0.1時,觀測數據與預測數據之間的關系

圖3 當eg=0.5,sc=0.5時,觀測數據與預測數據之間的關系

圖4 當eg=1,sc=1時,觀測數據與預測數據之間的關系
從圖中可以看到,在訓練前給定平均預測誤差的前提下,不同維數所得模型的預測結果。當維數是2時,觀測數據和預測數據具有很好的跟隨特性,既控制了觀測誤差,同時預測數據變化也很好地反映了觀測數據的變化。維數是4時,效果較差。而隨著維數的增大,效果變得更差,維數為5時最差。因此,以時間為基礎對莖體莖體含水量預測時,所使用的觀測數據維數并不是越大越好。由于垂柳莖體水分含量的測量單位是小時,因此含水量的變化與相近2 h內的測量值有密切關系。這一結論將大大減少實際應用時數據的存儲量,并可以大大提高計算的速度。
利用徑向基函數神經網絡建立垂柳莖體水分的日變化模型具有可行性,莖體含水量的日變化預測數據與觀測數據間具有很好的跟隨性。結果表明,并不是輸入向量維數越大越好,本試驗中2維的效果要明顯好于4維、5維。垂柳莖體水分的日變化與近2 h中的變化密切相關,與4,5 h等的變化相關不大。這為精準灌溉系統提供了很好的理論依據,大大地減小數據采集器的存儲容量,提高了計算處理數據的速度。
[1]Topp G C,Davis JL,Annan A P.Electromagnetic determination of soil water content:Measurement in coaxial transmission lines[J].Water Resour.Res.,1980,(16):574-582.
[2]Wullschleger SD,Hanson P J,Todd D E.Measuring stem water content in four deciduous hardwoods with a time-domain reflectometer[J].Tree Physiology,1996,(16):809-815.
[3]Irvine J,Grace J.Non-destructive measurement of stem water content by time domain reflectometry using short probes[J].Jour.Exp.Botany,1997,48(308):813-818.
[4]Nadler A,Raveh E,et al.Evaluation of TDR Use to Monitor Water Content in Stem of Lemon Trees and Soil and Their Response to Water Stress[J].SSSAJ,2003,67(2):437-448.
[5]王海蘭,白陳祥,趙燕東.喬木莖體水分傳感器探針結構實驗[J].農業機械學報,2009,1(40):176-179.
[6]王海蘭,鮑際平,趙燕東.應用SWR技術研究垂柳莖體含水率[J].科技導報,2009,8(27):69-72.