錢曄 孫吉紅 李曉曙 徐敏 劉庭 姜微微



摘要:為確保白芨種植戶(企業)獲得最大的經濟效益,科研人員取得精確的數據進行科學研究。首先,收集白芨種植過程中,澆水量、施肥量、噴灑農藥量以及對應的單位面積產量等數據,構建基于廣義回歸神經網絡(general regression neural network,簡稱GRNN)算法的智能預測模型對特定種植條件下白芨的產量進行預測,得到不同種植環境下白芨的不同產量數據;然后,將這些數據輸入信息系統中,為用戶提供數據,以便于在最適合的條件下種植白芨。試驗結果表明,GRNN在小樣本構建智能預測模型時能夠取得較好的預測效果。因此,在白芨種植過程中,當測試數據、輸入數據不斷增大的同時,采用該模型能夠為種植戶(企業)提高更精準的種植信息,最大化地提高產量,增加經濟效益;為科研人員提供準確的數據確保研究成果的真實性。
關鍵詞:白芨;智能;預測;GRNN算法;產量
中圖分類號: S126 ?文獻標志碼: A ?文章編號:1002-1302(2021)09-0190-05
大數據時代的到來,使各種農業數據爆炸式增長[1],加速了農業信息技術、云計算、智能算法的發展,為建立各類農業大數據中心提供了基礎數據。同時,全國各省市農業大數據中心陸續推動了數據分析方法的發展,將已經處于邊沿地帶的各種算法重新拉回了信息技術的核心位置,并處于不斷完善和改進中。針對農業種植行業,近年來,國內外學者采用回歸預測法、神經網絡法和灰色預測法等[2-4]進行了深入研究,其中時間序列模型對于非線性的預測并不理想[5-8],智能算法成為了主流預測方法。本研究采用傳統農業技術與信息技術(神經網絡算法、云計算等)相結合的方式,開展農業信息技術活動,將神經網絡算法進行改進,把統計的農業數據作為訓練數據,構建智能預測模型,以確保種植的農產品質量高、價格高、收益高。
白芨(Bletilla striata)為蘭科白芨屬植物,具有良好的藥用價值[9],在我國大部分省區均有分布,在云南省主要分布在昆明、文山、紅河、曲靖、寧洱、德宏和西雙版納等地,生長在海拔為500~2 600 m的疏林下陰濕處。白芨塊根白色,具有收斂止血、消腫生肌等功效[10]。近年來,由于白芨價格上漲,人們對野生白芨的過度濫采濫挖,加之白芨種子自然萌發率極低,導致野生白芨資源逐年稀少[11-14]。當前與白芨相關的論文及報道較少,僅限于白芨的多糖分析研究等[15-17]。云南省作為白芨的主要產區之一,每年種植企業、種植戶數量迅速增長,白芨逐漸占據云南省主要的中藥材市場。因此,通過構建云南省白芨種植過程信息采集系統,將采集的數據輸入基于廣義回歸神經網絡(general regression neural network,簡稱GRNN)算法構建的智能模型,預測白芨在單位面積內的產量,并通過信息平臺進行展示。
1 材料與方法
1.1 試驗數據來源及處理
1.1.1 構建管理信息系統 采用軟件工程方法學,在.net平臺下,采用C#語言構建白芨管理信息系統,系統功能主要有前臺功能和后臺功能,前臺功能包括用戶登錄、數據上傳、論壇等。后臺功能包括數據刪除、添加,用戶權限的修改。用戶權限包括管理員、一般用戶、會員用戶。管理員權限最高,能夠瀏覽前臺所有信息,能夠在后臺修改、刪除前臺的所用數據以及更改、刪除用戶權限及信息;一般用戶權限最低,只能夠瀏覽信息系統中的部分大眾信息;會員用戶主要是訂購信息,能夠從管理信息系統中獲取對白芨種植、生產過程中具有價值的數據,能夠在論壇中暢所欲言,能夠隨時與管理員保持交流、獲取相關信息。
1.1.2 收集數據 構建基于智能算法的白芨產量智能預測系統,實現用戶注冊、登錄、權限管理、種植戶(企業)填報相關種植信息、管理員增加或刪除用戶、上傳信息、用戶論壇等功能。其中,最主要的功能為收集數據,具體如下。
種植戶(企業)在注冊成為會員后,首先將進入種植信息上傳頁面(圖1),將種植白芨的信息上傳,為收集預測信息做準備。種植戶(企業)加入系統之后,將種植的所有信息填寫在信息表中,由管理員提取相關信息,用于收集構建智能預測模型的數據。
1.2 試驗方法
目前,對白芨的研究停滯于對白芨多糖含量的
研究,將白芨與信息技術結合構建智能預測模型,尚為首例,具有多學科結合的應用創新性。構建白芨產量管理信息系統和基于GRNN算法的產量預測模型的技術路線見圖2。
1.2.1 選擇算法 智能算法構建預測模型,通常采用的智能算法包括人工神經網絡算法、灰色算法、聚類分析等算法,每種算法都各有優缺點。例如,近年來最為流行的人工神經網絡算法中,BP(back propagation)神經網絡算法構建智能模型時,訓練樣本的時間較長,影響預測的準確率;GRNN算法適用于訓練樣本較少的智能模型;徑向基函數(radial basis function,簡稱RBF)神經網絡算法適用于訓練樣本較大的智能模型。但是,隨著信息技術、人工智能的發展,對智能模型的預測準確度越來越高。魏明樺等將BP神經網絡算法進行改進,構建農產品價格預測模型,取得較好的預測效果,具有推廣實踐的作用[18-19]。郭鵬飛將RBF 神經網絡算法進行改進,構建水質預測模型[20]。王李等將遺傳算法與BP 神經網絡相結合運用于水質預測中[21]。以上研究表明,近年來多位研究者已經將神經網絡算法進行改進并運用于各種模型的構建中。但是,在中草藥領域構建智能預測模型尚處于應用創新領域。結合白芨管理信息系統的特點以及信息系統建立初期信息量較小等情況,本研究將采用聚類分析結合GRNN算法構建基于改進的GRNN算法的智能模型。
1.2.2 數據處理 首先,須要對數據集中空缺數據、異常數據進行處理后才能作為樣本數據。出現數據空缺時,根據數據集中前后數據的關系進行填充;發現異常數據時,直接將異常數據刪除或者按空缺數據的情況進行處理。
1.2.3 GRNN預測模型構建 GRNN算法適用于小樣本的訓練集數據的模型構建,如果在數據訓練之前,采用聚類算法先將同類數據進行規整,將提高GRNN算法構建智能模型的準確率。具體步驟如下:
(1)在Matlab平臺下,采用聚類算法中pdist函數,用于計算輸入變量之間的距離;采用linkage函數定義變量之間的連接,cophenetic函數用于評價聚類信息;最后使用cluster函數創建聚類。
(2)使用歸一化算法獲取的數據集進行歸一化處理,所有數據控制在(-1,1)之間。
(3)由于GRNN模型中,第1層輸入層神經元個數與學習樣本中輸入向量維數相等,因此上一步中的數據集作為輸入樣本(Xn)將直接進入模式層中。
(4)學習樣本的數量與模式層中神經元的數量(n)一致,各個神經元(Pn)對應不同的樣本。
(5)根據求和公式計算學習樣本與模式層中神經元之間的距離。
(6)求和層進行求和后將進入輸出層,輸出層中各神經元(SD)將求和層的輸出數據(SNT)相除,得到模型的預測結果(YK)。
GRNN結構見圖3,用GRNN算法構建智能預測模型時將按照圖3進行。
2 結果與分析
2.1 確定白芨產量智能預測模型的輸入及輸入模式
由于該研究構建的信息系統尚未在線運行,以下內容以相同技術環境下的模擬數據進行試驗。在溫度可以恒定的溫室大棚中,將種植戶(企業)提供的澆水、施肥、噴灑農藥量等信息,進行歸一化處理后,作為輸入層的數據向量,確定GRNN算法的輸入層神經元個數為5,由于白芨產量作為輸出目標,確定輸出層的神經元個數為1。
2.2 基于GRNN算法的智能預測模型的實現
2.2.1 試驗數據 由于該研究中,白芨管理信息系統僅作為科學研究使用,尚未推出市場。本研究采用模擬數據進行試驗,白芨產量預測系統中影響產量的因子的部分模擬數據見表1、表2。
2.2.2 智能模型訓練 此次試驗采用了模擬數據,按照GRNN算法構建智能模型的要求,在Matlab平臺下,編寫訓練程序,建立基于智能算法的白芨產量預測模型。
2.2.3 GRNN算法構建白芨產量智能預測模型的實現 由于GRNN算法實用于樣本較小的智能預測模型構建。采用GRNN算法構建白芨產量智能預測模型的預測結果見表3,與試驗數據相比較,預測準確率達到80%以上,具有較好的預測準確率。
2.3 預測結果分析
從網絡預測誤差進行分析,網絡預測誤差見圖4,試驗中將光滑因子設置為0.01,目的為了提高預測的準確率,由于試驗數據為模擬數據,預測結果的準確率控制在90%以內,視為較精確的預測率。
由表3、圖4可知,該模型具有較為精確的預測率,表明基于GRNN算法構建白芨產量預測模型是合理可行的,顯示出模型的選擇算法的可行性,與傳統的預測方法相比較具有更好的實用性和推廣性。該模型不僅適用于白芨產量的預測,在適度改變參數的狀況下也適用于白芨質量智能預測模型的構建,為云南中藥材行業的健康發展提供了新路徑。
3 結論與討論
白芨作為重要的中藥材之一,在日常的生產、生活中具有重要的藥用價值,將白芨產業與智能算法、軟件工程等多學科相結合,可實現白芨產業的信息化發展,具有應用創新性。
本研究將聚類分析與GRNN算法相結合構建基于智能算法的白芨產量預測系統,充分將智能算法、軟件工程等信息技術與白芨產業的發展現狀相結合,構建白芨產業的大數據中心雛形。規避了傳統人工神經網絡算法的缺點,提高了預測的準確率。本研究將智能預測模型與管理信息系統相結合,實現種植戶、種植企業提供數據,管理員收集數據、利用智能模型分析數據、提供信息,其他用戶支付數據信息費用等類生態循環圈。
如圖5所示,在構建白芨管理信息系統的同時,如果將智能模型嵌入管理信息系統中,使得原本只能“聽”代碼指揮的系統具有模擬人工的智慧。一是采用聚類分析結合GRNN算法構建基于改進的GRNN算法的智能預測模型。二是構建白芨管理信息系統,在信息系統中設置預測模型的接口,用于上傳預測結果,并根據不同的權限進行展示,將實現智能預測系統在農業領域中的創新型應用。
參考文獻:
[1]王 劍,吳定峰. 大數據視角下農業科研信息資源共建共享模式探索[J]. 中國農學通報,2017,33(11):147-152.
[2]Hygh J S,Decarolis J F,Hill D B,et al. Multivariate regression as an energy assessment tool in early building design[J]. Building and Environment,2012,57(17):165-175.
[3]Ferreira P M,Ruano A E,Silva S,et al. Neural networks based predictive control for thermal comfort and energy savings in public buildings[J]. Energy and Buildings,2012,55:238-251.
[4]Leephakpreeda T. Grey prediction on indoor comfort tempera-ture for HVAC systems[J]. Expert Systems with Applications,2008,34(4):2284-2289.
[5]Kristiansen T. A time series spot price forecast model for the Nord Pool market[J]. International Journal of Electrical Power & Energy Systems,2014,61:20-26.
[6]Rojas I,Valenzuela O,Rojas F,et al. Soft-computing techniques and ARMA model for time series prediction[J]. Neurocomputing,2008,71(4):519-537.
[7]Buncic D,Moretto C. Forecasting Copper prices with dynamic averaging and selection models[J]. The North American Journal of Economics and Finance,2015,33:1-38.
[8]段青玲,張 磊,魏芳芳,等. 基于時間序列GA-SVR的水產品價格預測模型及驗證[J]. 農業工程學報,2017,33(1):308-314.
[9]王寶森,白紅麗,張 虹,等. 云南蒙自野生白芨中礦質元素含量分析[J]. 北方園藝,2011(2):181-182.
[10]張永為,蔣福升,王 寅,等. 白及產業現狀及可持續發展的探討[J]. 中華中醫藥學刊,2012,30(10):17-19.
[11]李 嶸,王喆之. 白及的研究概述及其資源利用對策[J]. 中草藥,2006,37(11):1751-1755.
[12]張亦誠. 白芨的生物特性及栽培技術[J]. 農業科技與信息,2007(11):45.
[13]劉逢芹,夏麗婭. 中藥白芨的現代研究概況[J]. 山東醫藥工業,2000(7):32-33.
[14]于占國,劉賢旺. 白芨研究進展[J]. 江西林業科技,2002(5):42-44.
[15]張 穎,周岐新,賴 舒. 白芨多糖對骨髓造血功能的影響[J]. 中藥藥理與臨床,2009,25(4):35-37.
[16]芮海云,吳國榮,陳景耀,等. 白芨中性多糖抗氧化作用的實驗研究[J]. 南京師大學報(自然科學版),2003,26(4):94-98.
[17]芮海云,吳國榮,陳景耀,等. 白芨中性雜多糖的分離純化與結構分析[J]. 安徽農業大學學報,2004,31(1):30-33.
[18]魏明樺,鄭金貴. 基于改進BP神經算法的農產品價格預測模型的構建與實現[J]. 唐山師范學院學報,2014,36(2):66-68.
[19]張永超,趙錄懷,王 昊,等. 基于環境氣體信息的BP神經網絡蘋果貯藏品質預測[J]. 江蘇農業學報,2020,36(1):194-198.
[20]郭鵬飛. 基于改進RBF神經網絡算法的水質預測模型研究[D]. 南昌:華東交通大學,2013.
[21]王 李,劉志斌,常 歡. 自適應遺傳BP神經網絡在水質預測中應用[J]. 微計算機信息,2011,27(4):230-231.