范嘉智,譚詩琪,羅 宇,莊翔宇,周 偉,羅 曼
長短期記憶神經網絡在多時次土壤水分動態預測中的應用①
范嘉智1,2,譚詩琪3,羅 宇1,莊翔宇4,周 偉1,羅 曼1
(1 中國氣象局氣象干部培訓學院湖南分院,長沙 410125;2 氣象防災減災湖南省重點實驗室,長沙 410118;3 湖南省氣象服務中心,長沙 410118;4 上海三澎機電有限公司,上海 200122)
基于長沙站2016—2019年10 cm深度土壤水分自動觀測小時數據集,利用長短期記憶神經網絡(LSTM)模型結合隨機采樣學習方法,開展了土壤水分多時次預測,結果表明:LSTM模型對6、12、24、48 h后的土壤體積含水量預測均方根誤差(RMSE)分別為0.22%、0.28%、0.38%、0.54%,決定系數(2)分別為0.99、0.99、0.98、0.96,除6 h預測步長外,準確率均優于自回歸整合滑動平均(ARIMA)模型,且誤差穩定、無異常值出現,預測準確率遠優于相關研究。該結果證實了基于LSTM模型精準預測土壤水分動態的可行性,為精準灌溉和干旱預警提供了計算機技術及手段支撐,為政府及科研部門水資源管理政策的制定提供了數據支持。
長短期記憶神經網絡(LSTM);土壤體積含水量;氣象因子;多時次預測;精準灌溉
水分是地球上的重要資源,是“土壤-植被-大氣”連續系統的關鍵紐帶[1-2]。其中,土壤水分作為碳水循環中的關鍵變量,是植物水分的主要來源[3]。基于中國干旱缺水及水資源分布不均的國情,土壤水分的準確預測對于作物生長狀況的判定、田間水分管理及施肥決策的制定有重要意義[4-5]。土壤水分含量及其動態變化受氣象因子(降水[6]、蒸散、氣溫和太陽輻射等)、土壤特性[7]、地形[8]、地表覆蓋等條件的影響[9]。對于固定觀測站點的土壤水分,降水幾乎是其唯一來源,氣溫、風和太陽輻射對蒸散(土壤水分消耗的主要方式)有著重要的影響[10]。相對于深層土壤,表層土壤更易受這些因子的影響,因而表現出更高的預測難度[11]。
目前主流的土壤水分預測方法大多使用經驗模型[12]、線性回歸模型[13-14]、時間序列模型[15]、神經網絡模型[5,16-18]。經驗模型較為簡單、便于理解,但其參數具有較強的地域特征,模型的建立耗時長且低效;線性回歸方法擬合非線性的土壤水分數據存在諸多限制,其準確度與預測的需求也有較大差距;時間序列模型因各地數據波動幅度差異預測準確性差異較大[19],限制了模型的推廣;神經網絡模型經歷多年發展,在多種氣象、水文參數的預測上證實了其極強的擬合、預測能力[20-23]。因此,神經網絡模型的合理構建有望更準確地預測土壤水分存在的非線性時空異質性[24]。
對土壤水分的準確探測與預測是精準灌溉的前提,有助于精細化農業生產。而由于受到多種因素的影響,土壤水分呈現出復雜的變化特征,有季節性的變化趨勢,也有隨機的特征變化,研究利用機器學習算法結合氣象觀測數據以提升土壤水分預測準確率,對于農業水資源管理和最終實現高產、優質農業有重要意義。
研究數據為基于頻域反射法自動觀測10 cm深度的土壤水分數據,來源于湖南省長沙市黃花站自動土壤水分觀測站。該站點位于28.21° N,113.2°E,海拔101.4 m,屬于亞熱帶季風氣候區,氣候溫和、降水充沛、雨熱同期、四季分明,年平均氣溫17.2℃,年降水1 358 ~ 1 553 mm。本研究數據源自于全國綜合氣象信息共享平臺(CIMISS),選用2016年1月1日0時至2019年5月18日23時土壤體積含水量每小時數據,其中存在199條缺測數據及1條異常數據,占比0.68%,均采用前后均值進行插補。前期查閱文獻及相關性分析確定了輸入變量中的氣象參數為:氣壓、氣溫、露點溫度、相對濕度、水汽壓、1 h降水量、最大風速、地面溫度、5 cm地溫、10 cm地溫、15 cm地溫、能見度,其均為同時間段的小時觀測數據。將每小時對應的氣象參數與土壤含水量整理為一個數據庫,以此進行長短期記憶神經網絡(LSTM)模型的訓練和預測,并與自回歸整合滑動平均(ARIMA)模型預測結果對比。
1.2.1 LSTM模型介紹 人工神經網絡(ANN)是一種模擬人腦運行方式而設計的計算模型,它通過類似于生物神經元的節點連接而成,不同節點間的連接被賦予不同權重,每個節點代表了一種特定函數,節點接收經過相應權重綜合過的信息,經過激活函數計算輸出信息至下一層節點。理論上來說,一個足夠深度的人工神經網絡可以逼近任意的函數,因此,神經網絡作為一種可學習的函數結構,被廣泛用于機器學習、數據擬合等領域,并取得了相當豐碩的成果[25]。
在如土壤水分時間序列這類時序數據的處理上,因每個時次的參數會受之前參數水平的影響,所以處理這些數據的神經網絡需要具有記憶能力。20世紀八九十年代出現的循環神經網絡(RNN)通過節點之間的連接,使其同時可以接收自身和其他節點的信息,形成具有環路的網絡結構,能以很高的效率對序列的非線性特征進行學習[26]。長短期記憶網絡(LSTM)[27-28]是循環神經網絡的一種變體,它通過引入新的內部狀態和門機制,有效解決了梯度爆炸和消失問題(圖1)。作為目前最成功的循環神經網絡模型,LSTM被成功應用在語音識別、機器翻譯[29]、語音模型及文本生成等領域。
1.2.2 LSTM模型建立 LSTM模型的優勢在于可以從多次的學習過程中挖掘數據間的聯系,通過神經元之間的連接權重傳遞信息,并經過一次次的重復訓練優化模型。本研究整理后的數據庫共29 616條數據,包括氣象參數和土壤體積含水量數據,為防止訓練過程中的梯度爆炸,需要將參數進行歸一化處理:

式中:x為土壤體積含水量觀測數據集,y為歸一化后的數據集,max、min分別為原始數據集中最大值和最小值,歸一化后數據范圍為[0, 1]。
選取數據庫中約80% 數據作為訓練數據,共23 692條數據,剩余數據作為測試集。因神經網絡模型易出現過擬合現象,造成在訓練數據上的擬合能力遠好于測試集,所以在其中再選取約10% 的數據作為訓練過程中的驗證集,其余為訓練集。若驗證集的均方誤差(MSE)在20輪訓練內沒有改進,則將MSE最小的那次訓練作為最終模型,否則訓練至設置的訓練輪數。均方誤差的計算如下:


模型的訓練需要提前設定參數,如神經網絡層數、每層的神經元節點數、激活函數類型、訓練輪數、優化器類型等。不適宜的模型參數會加大模型計算量、增大預測誤差或降低模型泛化能力。經過在R語言中的多輪測試及優化,最終得出如下7層模型結構,見表1。模型輸入數據為列表型三維結構數據,每一輪訓練輸入13個128×48矩陣數據組,其中13個數據組為包括土壤水分在內的13個輸入因子,每一輪訓練隨機從訓練集中抽取128條數據的前48 h至前1 h觀測值組成輸入數據列表,經本研究結構模型運行多輪后輸出數據為128×4矩陣數據,對應128條數據的后6、12、24、48 h的土壤水分。為防止訓練過程中的過擬合,在模型結構中添加的Dropput層是一種基于權重比例推斷規則的正則化方法。模型激活函數選定為“linear”,優化器為“adam”,訓練最大輪數定為500。

表1 土壤水分預測LSTM模型結構表
1.2.3 ARIMA模型建立 假定一個時間序列數據中部分是自回歸,部分是滑動平均,可以得到一個較普遍的時間序列模型,如:

式中:e前為序列Y的階自回歸過程,其后為階滑動平均過程,稱{Y}為自回歸滑動平均模型,階數分別為和,簡記為ARMA(,)。如果有一個時間序列{Q}的次差分:

其是一個平穩的ARMA過程,則稱{Q}為自回歸整合滑動平均模型。如果W服從ARMA(,)模型,則稱{ Q}是ARIMA(,,)過程。利用ARIMA模型預測土壤水分需要如下流程:①需要判斷時間序列是否平穩,對于非平穩時間序列需要多次差分直到其平穩,差分次數記為;②計算序列的自相關函數和偏自相關函數,根據函數的截尾和拖尾狀態決定和值;③建立 ARIMA(,,)模型,檢驗其是否具有統計學意義及判斷殘差序列是否為白噪聲序列;④利用已通過檢驗的模型進行預測。為了避免參數不同造成的LSTM模型和ARIMA模型預測精度差異,ARIMA模型的輸入序列也設置為前48 h的土壤水分數據,預測后6、12、24、48 h的土壤水分參數值,在循環算法下,每次引入新的時間序列均會重新建立ARIMA模型,并在99.5% 的置信水平下預測。
1.2.4 評價指標 對于LSTM模型預測精度的評價,利用訓練后的模型對測試集數據6、12、24、48 h后的土壤水分進行預測,每一個測試集中的LSTM模型預測值均有對應時次的ARIMA模型預測值供對比。利用如下4種指標評價兩種模型的預測準確性。
平均絕對誤差(MAE):

均方根誤差(RMSE):
相對誤差值(RE):
決定系數(2):

1.2.5 數據分析軟件 本研究模型建立、運行和計算及作圖過程均在R語言(版本3.6.0)中完成。LSTM模型的建立基于keras深度學習框架(https://keras. rstudio.com),ARIMA模型的建立利用了“forecast”包,作圖利用了“ggplot2”包[30]。
歸一化之前的10 cm土壤水分時間序列如圖2所示,虛線之前為訓練集,虛線和實線之間為驗證集,實線后為測試集。可以看出,該層土壤水分波動較大,但有一定的季節趨勢,其中峰值出現在2017年7月1日下午4時,土壤體積含水量達40.5%,當時正值長沙遭遇超歷史極值暴雨導致的嚴重洪澇災害[31]。
圖3為多輪訓練下訓練集和驗證集的MSE結果,模型每一輪的訓練及驗證集對比時間共58 s,在第12輪訓練時,針對歸一化后的參數值,驗證集上MSE為最小值0.003 28,并且此后20輪訓練再無提升,故以第12輪訓練的模型為最終模型。
使用LSTM模型在訓練集和測試集上計算擬合值,并將其反歸一化處理,使用ARIMA模型針對測試集中每個時次的土壤水分參數計算擬合值。利用評估參數對比LSTM模型訓練集、LSTM模型測試集和ARIMA模型測試集中擬合值與真實值的差異性,評估參數如表2。LSTM模型擬合能力極強,訓練集上隨預測步長增加,誤差增長較低。測試集上短預測步長下LSTM模型與ARIMA模型效果相似,隨著預測步長的增加,ARIMA模型RMSE成倍增加,因此ARIMA模型預測的極端異常值較多,這也是其2明顯偏低的原因。但LSTM模型測試集參數相對訓練集有所升高,模型泛化能力仍有提升空間。

表2 LSTM與ARIMA模型擬合效果
圖4中,在4個步長下,擬合值都能較好地捕捉到土壤水分的變化趨勢,只是隨著預測步長的增加,預測值與真實值間的誤差略有增加,但仍處于可接受的范圍內,其2也一直表現出0.9以上的高相關性,模擬效果較好。
圖5和圖6為6、12、24、48 h下的LSTM和ARIMA模型預測值與真實值的對比結果,可以看出,LSTM模型在較短的預測步長下,預測值與真實值基本一致,但隨著步長的增加,對于土壤水分極端值的預測相對于中間值偏差較大(圖5)。ARIMA模型在所有預測步長下都有極端異常值的出現,且異常值均為大值參數(圖6)。
LSTM模型的一個重要優勢就是能夠通過學習挖掘和熔斷參數間的聯系,因此輸入因子需要盡量全面且精簡,且必須有足夠的觀測數據,否則會因欠擬合造成預測效果不佳[32]。降水是影響土壤水分最直接的要素,一般情況下土壤水分變化趨勢與降水量變化趨勢基本一致[33],但由于降水的下滲過程,二者存在一定時間差[34]。總體而言,土壤的干濕季與氣候的干濕季基本一致。降水對土壤水分的影響與降水量、強度、時長等諸多因素有關,一般大于10 mm的降水才能夠使土壤水分含量發生改變[35-36],這一閾值也與地表覆蓋和土壤水分狀況相關[10]。相關研究[3]證明,降水量與土壤水分間的相關關系因降水量級不同有所差異[37],且會因隨機性過強而產生干擾。濕度作為同樣可以反映水分狀況的指標,以及溫度、風速、太陽輻射等作為影響蒸騰作用的指標,均有必要作為輸入因子。氣壓和能見度與土壤水分的關系并不明朗,是否將其作為輸入因子對預測結果影響極小,但基于LSTM模型的熔斷機制,仍將其加入分析,通過LSTM模型的學習過程進行因子權重的設置。
作為一種高效的神經網絡模型,LSTM模型鮮少被利用在土壤水分數據擬合及預測上。本研究對于土壤水分動態的成功預測證實了LSTM模型在復雜的土壤水分數據擬合上的能力,相對ARIMA模型其預測精度在短時間步長上相近,長時間步長上具有明顯優勢,且預測誤差較穩定,沒有極端值的出現。本研究基于LSTM模型的土壤水分預測效果與前人的研究相比有著較大的提升。冀榮華等[16]利用復數神經網絡模型和誤差反向傳播神經網絡模型對土壤墑情每小時觀測數據進行預測,一步預測RMSE可達0.883、0.897 m3/m3,遠低于本研究的準確率。Gill等[17]利用支持向量機法對4個和7個時次后的土壤水分進行預測,RMSE分別為4.05%、4.19%,其準確率低于本研究48個時次的預測準確率。聶紅梅等[38]利用支持向量回歸機基于氣象、地形、土壤屬性參數對土壤水分進行預測,表層土壤水分RMSE為7.521%,其精度低于本研究結果。李寧等[18]利用改進的自適應遺傳神經網絡算法對24 h后的土壤濕度進行預測,最優MAE可達到1.26%,遠低于本研究的0.239%。
LSTM模型在多時次土壤水分預測上的成功應用證實了其在處理長時間序列數據時強大的擬合能力,本研究中所采用的7層模型結構為多次測試下的相對最優結構,但模型結構優化過程對于預測精度的提升較為有限。本研究中所構筑的輸入集隨機采樣過程和訓練過程中的檢驗、提前中止機制在機理上更符合時間序列數據的分析需求,也為LSTM模型的應用作出了輔助貢獻。應用LSTM模型對多時次土壤水分的準確預測,為土壤水分的預測預報方式提供了技術指導,為農業生產水資源保障工作提供了數據支撐,可對現有預測方法準確率的提升提供指導方向,提高精準灌溉、干旱預警等工作的準確性。
基于長沙自動土壤水分觀測小時數據的研究證明,利用長短期記憶神經網絡(LSTM)模型可以對土壤水分含量進行多時次預測,采用隨機采樣輸入前48 h的氣象觀測數據和土壤水分含量數據,經過12輪學習和評估,所得模型預測后6、12、24、48 h土壤水分含量的RMSE分別為0.22%、0.28%、0.38%、0.54%,預測準確率遠優于相關研究,但在優化模型提升泛化能力上仍有提升空間,研究結果可為精準灌溉和農業水資源管理提供數據支持。
[1] Schlesinger W H, Jasechko S. Transpiration in the global water cycle[J]. Agricultural and Forest Meteorology, 2014, 189/190:115–117.
[2] 張義, 謝永生, 郝明德. 黃土高原溝壑區塬面蘋果園土壤水分特征分析[J]. 土壤, 2011, 43(2): 293–298.
[3] Cai Y, Zheng W G, Zhang X, et al. Research on soil moisture prediction model based on deep learning[J]. PLoS One, 2019, 14(4): e0214508.
[4] Chukalla A D, Krol M S, Hoekstra A Y. Green and blue water footprint reduction in irrigated agriculture: effect of irrigation techniques, irrigation strategies and mulching[J]. Hydrology and Earth System Sciences, 2015, 19(12): 4877–4891.
[5] 侯曉麗, 馮躍華, 吳光輝, 等. 基于人工神經網絡土壤墑情動態預測模型應用研究[J]. 節水灌溉, 2016(7): 70–72, 76.
[6] 辛祥, 林青, 黃修東, 等. 大沽河下游農田土壤水分含量動態變化特征[J]. 土壤, 2019, 51(2): 390–398.
[7] Singh J, Milchunas D, Lauenroth W. Soil water dynamics and vegetation patterns in a semiarid grassland[J]. Plant ecology, 1998, 134(1): 77-89.
[8] 劉鑫, 畢華興, 李笑吟, 等. 晉西黃土區基于地形因子的土壤水分分異規律研究[J]. 土壤學報, 2007, 44(3): 411–417.
[9] 王俊霞, 潘耀忠, 朱秀芳, 等. 土壤水分反演特征變量研究綜述[J]. 土壤學報, 2019, 56(1): 23–35.
[10] 何其華, 何永華, 包維楷. 干旱半干旱區山地土壤水分動態變化[J]. 山地學報, 2003, 21(2): 149–156.
[11] 阿拉木薩, 周麗芳. 科爾沁沙地流動沙丘土壤水分空間變化特征分析[J]. 土壤, 2011, 43(3): 392–397.
[12] Jackson S H. Comparison of calculated and measured volumetric water content at four field sites[J]. Agricultural Water Management, 2003, 58(3):209–222.
[13] Hummel J W, Sudduth K A, Hollinger S E. Soil moisture and organic matter prediction of surface and subsurface soils using an NIR soil sensor[J]. Computers and Electronics in Agriculture, 2001, 32(2): 149–165.
[14] 舒素芳, 錢華峰, 邱小偉. 基于氣象因子的金華市土壤墑情預測模型[J]. 中國農業氣象, 2009, 30(2): 180–184.
[15] 劉洪斌, 武偉, 魏朝富, 等. 土壤水分預測神經網絡模型和時間序列模型比較研究[J]. 農業工程學報, 2003, 19(4): 33–36.
[16] 冀榮華, 張舒蕾, 鄭立華, 等. 基于多值神經元復數神經網絡的土壤墑情預測[J]. 農業工程學報, 2017, 33(S1): 126–131.
[17] Gill M K, Asefa T, Kemblowski M W, et al. Soil moisture prediction using support vector machines[J]. Journal of the American Water Resources Association, 2006, 42(4): 1033–1046.
[18] 李寧, 張琪, 楊福興, 等. 土壤墑情預測自適應遺傳神經網絡算法研究[J]. 計算機工程與應用, 2018, 54(1): 54–59, 69.
[19] 白冬妹, 郭滿才, 郭忠升, 等. 時間序列自回歸模型在土壤水分預測中的應用研究[J]. 中國水土保持, 2014(2): 42–45, 69.
[20] 石靈芝, 鄧啟紅, 路嬋, 等. 基于BP人工神經網絡的大氣顆粒物PM10質量濃度預測[J]. 中南大學學報(自然科學版), 2012, 43(5): 1969–1974.
[21] 崔東文. 多隱層BP神經網絡模型在徑流預測中的應用[J]. 水文, 2013, 33(1): 68–73.
[22] 黃小華, 李德源, 呂文閣, 等. 基于人工神經網絡模型的風速預測[J]. 太陽能學報, 2011, 32(2): 193–197.
[23] Song X D, Zhang G L, Liu F, et al. Modeling spatio-temporal distribution of soil moisture by deep learning-based cellular automata model[J]. Journal of Arid Land, 2016, 8(5): 734–748.
[24] 劉凱, 高磊, 彭新華, 等. 半干旱區科爾沁沙地土壤水分時空特征研究[J]. 土壤, 2015, 47(4): 765–772.
[25] 周飛燕, 金林鵬, 董軍. 卷積神經網絡研究綜述[J]. 計算機學報, 2017, 40(6): 1229–1251.
[26] Goodfellow I, Bengio Y, Courville A. Deep learning[M]. MIT press, 2016.
[27] Gers F A, Schmidhuber J, Cummins F. Learning to forget: continual prediction with LSTM[J]. Neural Computation, 2000, 12(10): 2451–2471.
[28] Hochreiter S, Schmidhuber J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735–1780.
[29] Sutskever I, Vinyals O, Le Q V. Sequence to sequence learning with neural networks[EB/OL]. 2014: arXiv: 1409.3215[cs.CL]. https://arxiv.org/abs/1409.3215.
[30] Wickham H. ggplot2: elegant graphics for data analysis[M]. Springer, 2016.
[31] 蔣祺, 鄭伯紅. 城市雨洪調蓄空間對洪澇災害影響研究——以長沙市2017年洪澇災害為例[J]. 自然災害學報, 2018, 27(3): 29–38.
[32] Prakash S, Sharma A, Sahu S S. Soil Moisture Prediction Using Machine Learning[C]. 2018 Second International Conference on Inventive Communication and Computa-tional Technologies (ICICCT), 2018: 1-6.
[33] 王孟本, 李洪建. 晉西北黃土區人工林土壤水分動態的定量研究[J]. 生態學報, 1995, 15(2): 178–184.
[34] 蘇敏, 盧宗凡, 李夠霞. 陜北丘陵溝壑區主要農作物水分利用與平衡[J]. 水土保持研究, 1996, 3(2): 36–45.
[35] 楊新民. 黃土高原灌木林地水分環境特性研究[J]. 干旱區研究, 2001, 18(1): 8–13.
[36] Coronato F R, Bertiller M B. Precipitation and landscape related effects on soil moisture in semi-arid rangelands of Patagonia[J]. Journal of Arid Environments, 1996, 34(1):1–9.
[37] 劉冰, 趙文智, 常學向, 等. 黑河流域荒漠區土壤水分對降水脈動響應[J]. 中國沙漠, 2011, 31(3): 716–722.
[38] 聶紅梅, 楊聯安, 李新堯, 等. 基于PCA-SVR的冬小麥土壤水分預測[J]. 土壤, 2018, 50(4): 812–818.
Application of Long/Short Term Memory Neural Network in Soil Moisture Multi-time Dynamic Prediction
FAN Jiazhi1,2, TAN Shiqi3, LUO Yu1, ZHUANG Xiangyu4, ZHOU Wei1, LUO Man1
(1 China Meteorological Administration Training Centre Hunan Branch, Changsha 410125, China; 2 Key Laboratory of Hunan Province for Meteorological Disaster Prevention and Mitigation, Changsha 410118, China; 3 Hunan Meteorological Service Center, Changsha 410118, China; 4 Senpro Mechanical & Electrical Co., Ltd, Shanghai 200122, China)
Based on the data set of hourly soil moisture automatic observation at 10 cm depths from 2016 to 2019 in Changsha Hydrometric Station, the neural network of Long/Short Term Memory (LSTM) combined with random sampling learning was used to carry out multi-time prediction of soil moisture. The results showed that RMSE of prediction in 6, 12, 24, 48 h was 0.22%, 0.28%, 0.38%, 0.54%, and coefficient of determination (2) was 0.99, 0.99, 0.98, 0.96, respectively. The prediction accuracy was better than Autoregressive Integrated Moving Average (ARIMA) model except the 6 h, the deviation was stable and no abnormal value appeared, the prediction accuracy was far better than relevant studies. The results prove that the feasibility of accurately predicting in soil moisture dynamics based on LSTM model, provide computer technology and means for accurate irrigation and drought warning, and data support for the formulation of water resource management policies by government and research institutions.
Long short-term memory; Soil volumetric moisture content; Meteorological factor; Multi-time prediction; Precise irrigation
S152.7
A
10.13758/j.cnki.tr.2021.01.028
范嘉智, 譚詩琪, 羅宇, 等. 長短期記憶神經網絡在多時次土壤水分動態預測中的應用. 土壤, 2021, 53(1): 209–216.
中國氣象局氣象干部培訓學院科研項目(內2018-015)和湖南省氣象局短平快科研項目(XQKJ18B070)資助。
范嘉智(1992—),男,安徽馬鞍山人,碩士,工程師,主要從事農業氣象研究。E-mail:fjz92419@hotmail.com