孫吉紅,錢 曄,周 正,張劍波
(1.云南省科學技術院,昆明 650000;2.云南農業大學大數據學院(信息工程學院),昆明 650201;3.云南省高校農業信息技術重點實驗室,昆明 650201)
云南省香料植物品種豐富,種類多樣性和香氣多樣性均在全國前列,素有“植物王國”美譽,目前已探明種類有18 000 余個,占全國植物品種總量的51.6%。其中,省內發現或引種的香料植物超過400種,與國內已報道的800 余種香料植物相比,約占50%,品種豐富程度在全國位居前列[1]。云南省地處亞熱帶、熱帶,在云貴高原復雜地貌特征的影響下,氣溫隨海拔的升高差異明顯,形成了獨特的立體式地理氣候條件,非常適宜香料植物的生長[2]。因此,不僅世界上大多數的香料植物都能在云南省找到適宜生長、繁衍的地區,而且植物次生代謝物質積累充分,香料植物產量更高、香氣更好。云南省天然芳香作物種植面積約27萬hm2,位居全國前列。從事天然香料種植和初加工的農民已超過200 萬人,其中,八角、草果、小黃姜、花椒、砂仁等特色天然香辛(調味料)種植面積均為全國最大。近年來,隨著香料植物品種的不斷開發和引進,云南省香料作植種植面積仍在不斷增加[2,3]。僅玫瑰花種植面積已接近全國總面積的25%,約0.4萬hm2。
無論從氣候環境、地理位置,還是香料種類、種植面積方面,云南省都具有優勢,但香料價格不穩定,主要表現在連續幾年高售價的香料下一年可能價格大跌,嚴重影響種植戶的收入,甚至導致中小型種植企業陷入危機。近年來,大數據技術的迅速發展,各行業大數據中心的建立為解決行業中存在的問題提供了專業化平臺,各種智能算法的衍生為解決各行業的具體難題提供了技術支撐。為此,本研究致力于在深度學習的環境下,以云南省最具代表性的草果為研究對象,采用智能算法構建草果種植推薦模型,在此基礎上進行推廣應用,構建多種香料種植推薦模型,形成云南省香料種植推薦模型群,并搭建信息平臺,為種植戶、種植企業、科研人員等提供具有參考意義的數據。
本研究以草果為研究對象,在深度學習環境下,采用人工神經網絡算法,構建基于智能算法的草果種植推薦系統,對草果的產量、質量、價格分別進行預測,形成一個草果產業化的推薦系統。
智能推薦模型的前身主要是指基于智能算法的價格(產量)預測模型,一般情況下,以人工神經網絡算法或者遺傳算法等定量性算法為基礎,在收集整理大量數據的基礎上,確定影響研究對象價格(產量)的因素,并將收集的數據填充進影響因素中,初步形成構建智能模型的數據集,并采用拉依達準則等相關算法尋找并刪除異常數據,根據數據之間的關系以及收集數據所屬行業領域補充空缺的數據,形成完整的數據集合[4];根據數據集合的基本情況,將該集合分為訓練集合、測試集合;根據數據集合中數據量的大小結合智能算法的特點擬定構建智能模型的算法。所有預備工作做好后,在構建智能模型的平臺上,按照智能算法構建模型的步驟進行模型構建,然后進行價格(產量)預測[5],將預測的結果與實際的結果進行對比,得到智能預測模型預測的準確率。如果預測結果與實際結果相差較大,則返回智能算法選擇這一步驟,并且檢查數據收集的關鍵環境是否有誤。如果預測結果接近于實際的結果將完成智能模型的構建。在此,需要強調的是智能算法構建模型,它是一個不斷學習的過程,學習的次數特別重要,如果數據量太小,無論選擇哪一種算法都無法得到精準的預測結果。只有當數據量達到一定規模時,才能準確判斷該模型是否需要修改完善。因此,數據量的大小成為了構建智能預測模型關鍵因素之一。
經過多位學者的研究還發現,構建智能預測模型關鍵的因素是正確確定影響預測對象的價格、產量、需求量、銷售量等因素。隨著大數據技術時代的來臨,各種智能算法深入多個領域的研究工作中。錢曄等[6]提出了采用人工神經網絡算法構建基于鮮切花價格影響因素的驗證模型。主要是采用管理學中頭腦風暴法收集整理歸納專家意見。然后,采用名義小組技術將形成的意見分別發給每一位技術專家,形成影響鮮切花價格的影響因素。最后,采用人工神經網絡算法構建的驗證模型進行驗證。總之,構建智能預測模型[7]的關鍵點在于影響因素、對應的數據集合、適合的算法以及模型的調試驗證等。目前,科研人員在農產品價格預測的應用中,主要采用的智能分析方法包括神經網絡預測[8-10]、灰色預測法[11]、支持向量機[12]等。
目前,云南省怒江州境內草果種植面積已經超過3.33 萬hm2,主要采用林下種植的方式,在河溝、濕度大的陰山面進行大量種植,已經成為云南省乃至全國草果種植基地的特色。以怒江州境內種植的草果為研究對象,采用人工神經網絡算法構建基于智能算法的草果產量預測模型。
1.2.1 確定試驗數據集 在云南省怒江州境內草果種植基地,安裝傳感器實時采集種植草果期間每天的澆水量、施肥量、噴灑農藥量、溫度、濕度等相關數據,如遇空缺則標記為“0”,因為草果從播種至收貨的時間周期為5~6 個月。因此,該模型的數據收集的一個周期為5~6 個月。在收集數據期間內,至少收集3年的數據,形成6 個種植周期的數據信息,大約為1 095 組信息,形成本研究中草果產量智能預測模型的數據集合。然后,分別將各類信息進行歸納整理,剔除異常數據、補充空缺數量,并通過歸一化算法將數據集合中的數據控制在(0,1)中。其中,將前2 個周期的數據集合作為測試集數據,后面4 個周期的數據集合作為訓練集數據。
歸一化算法[13]是使用premnmx 函數進行數據歸一化處理,對預測對象的影響因素及預測對象進行歸一化處理,使得各影響因素及對應的預測值控制在(-1,1)的區間。語法格式為:

式(1)中,P表示歸一化后的數據集合;p表示需要歸一化的數據集合;式(2)中,m為隨機變量,max<m<min。
1.2.2 擬定并驗證影響因素 目前,尚未有科研人員針對草果的產量影響因素進行深入研究。僅有部分研究人員[13]針對某種農產品進行產量預測。本研究將傳感器中收集整理的各類數據暫定為影響草果產量的因素進行研究,主要依據為暫定影響因素囊括了草果種植過程中所有可能產生的數據類型,具體包括種植草果過程中記錄的溫度、濕度、光照度、澆水量、施肥量、噴灑農藥量等數據。
1.2.3 修改并確定構建智能模型的算法 大數據技術發展至今,已經產生了多種不同的智能算法,以最典型的人工神經網絡算法為例,不同的算法具有不同的特點,例如模糊神經網絡算法針對空缺數據較多、異常數據量較大的情況下,能夠提高模型預測的精準率;GRNN 神經網絡算法適合在訓練樣本較小的情況下,提高模型預測的準確率;RBF 神經網絡算法作為傳統BP 神經網絡算法的補充算法,規避了BP 神經網絡算法訓練速度較慢的特點,適合在訓練數據、測試數據量較大的情況下使用。每種算法都具有各自不同的特點,但是在試驗過程中,根據數據的特點去匹配算法時,同樣會遇到問題。部分研究人員直接選擇數據集與之最匹配的算法進行智能模型構建,在少量的試驗過程中將難以區別這種選擇的缺陷。但是,在實際的生產過程中,將會暴露該類做法的缺陷,即在數據量不斷增加,試驗次數不斷加大的情況下,該類模型的預測結果會出現不穩定現象。為了規避預測結果不穩定帶來的影響,在確定算法的過程中,將采用以下方式對算法進行相應的完善。以BP 人工神經網絡算法為例,構建智能預測模型時,可以采用啟發式改進方法對算法進行改進,具體方法包括:構建模型時,將權值的范圍設置為1-n,即將權值設置為1、2、3,…,n,用于調整權值,解決BP 神經網絡在學習訓練過程中的難題。同時,可以將BP 人工神經網絡算法與遺傳算法或者灰色算法等進行有機結合,形成一種新的算法,提高網絡訓練的速度和預測的準確率,也可以通過歸一化算法、拉依達準則等算法提升測試集、訓練集數據的質量,以此提高智能預測模型的準確率。
1.2.4 草果產量預測模型的構建 本研究基于怒江州草果種植基地,采用傳感器收集數據,將收集到的3年6 個周期的數據進行整理,形成構建草果產量預測模型的數據集合,采用RBF 人工神經網絡算法,以MATLAB 為平臺構建智能產量預測模型。
1)確定輸入輸出模式。輸入模式為影響草果產量的因素,包括種植草果過程中每天的澆水量、施肥量、噴灑農藥量、溫度、濕度等相關數據。綜上所述,該模型中輸入向量包括影響草果產量的因素;輸出向量為1,輸出層神經元個數設置為1。
2)智能模型網絡訓練。將數據集合中前兩期共365 組數據作為測試集樣本數據輸入RBF 網絡中,然后分別設置隱含層節點數、網絡最大訓練次數、平均誤差、學習速率等。試驗過程中,分別設置隱含層節點數,然后對應輸入剩余的4 組共730 組數據作為訓練集樣本數。分別輸出不同的預測結果,并與實際產量進行對比,設置的哪一個節點對應的預測結果準確率最高,哪一個節點為確定的隱含層節點。
3)智能預測結果及分析。本研究中隱含層節點數設置為1~7,RBF 預測結果將產生7 個不同的結果,分別將7 個預測結果除以實際產量,得到預測的準確率,選取準確率最高的結果為預期模型。當準確率低于85%時,將返回至確定影響因素的步驟,重新確定影響草果產量的因素。
深度學習環境下草果種植推薦模型的研究主要包括草果產量智能預測模型、草果質量智能預測模型、草果病蟲害智能預測模型、草果價格智能預測模型等。在深度學習環境下,構建草果智能預測模型群的方法與以上方法類似,按照已構建的基于智能算法的草果質量預測模型可以構建其余的模型,形成基于智能算法的草果種植智能模型群,從草果的選種、種植管理、銷售、反饋一體化智能管理系統,為云南省草果行業的發展提供一種新思路。結合云南省怒江州草果種植的實際情況,構建基于云環境下草果種植管理平臺,具體情況如圖1、圖2、圖3 所示。
整個平臺包括3 個模塊,第一個模塊是基于智能算法的草果種植推薦模型群,第二個模塊是用戶權限管理,第三個模塊是云環境下草果種植管理平臺。其中,第一個模塊作為整個平臺的核心部分,主要是針對草果的價格、產量、質量、病蟲害進行預測,為農戶提供下一個種植周期,包括草果的種植品種、種植規模、種植過程中病蟲害的防治方法,為提升草果的品質,增加農戶的收入提供智力支持,為草果種植、加工、銷售企業提供企業發展指南,為研究香精香料的研究人員提供了數據支持,具體內容詳見圖1。

圖1 基于智能算法的草果種植推薦模型群
第二個模塊主要是用戶權限管理,在此強調用戶權限管理主要是該平臺的建設與用戶的使用權限關聯緊密,對于游客僅能夠瀏覽系統中的公開信息,將注冊付費后的普通會員分為種植戶、種植企業、銷售企業、加工企業、科研人員5 個類型。種植戶能夠收到草果種植下一季的價格、產量、質量預測的數據以及針對下一季當地氣候環境病蟲害防治方法;種植企業相對于種植戶可以獲取更廣泛的數據信息,例如:能夠收到草果種植下一年的價格、產量、質量預測的數據以及針對當地氣候環境病蟲害防治方法;銷售企業、加工企業收到的信息更為聚焦,能夠獲取下一年每天的銷售預測價格等重要信息;科研人員能夠獲取基于智能算法的草果種植推薦模型中預測的所有數據值,僅能用于科學研究工作的開展,并且科研成果必須用于該平臺的修整完善。超級會員作為該平臺受益最多的群體,能夠查詢到所有智能模型的推薦結果,并且能夠享受定制化的服務。管理員除了擁有超級會員的權限外,同時需要承擔管理整個平臺的責任。具體內容詳見圖2。

圖2 用戶權限管理
圖3 所示為云環境下草果種植管理平臺,在基于智能算法的草果種植推薦群、用戶管理2 個模塊的共同作用下,構建云環境下草果種植管理平臺,該平臺的主要功能包括:用戶權限管理、經營模式管理、數據共享模式管理、數據采集系統管理等模塊。最值得關注的是本研究主要基于云環境下構建智能推薦平臺,由于用戶數量大、推薦數據準確性高、用戶收費底、效果好等優點,不但能夠為用戶提供滿意的服務,農戶致富、企業發展壯大、科研人員獲得發展的空間,更重要的是能夠在不斷壯大、激活該智能平臺的基礎上,促進云南省乃至全國草果行業的發展。

圖3 云環境下草果種植管理平臺
本研究基于深度學習環境下,以人工智能算法為基礎,選取草果種植為例構建香料種植推薦模型,解決農戶、企業種植全過程中的難題,為科研人員提供構建智能模型時所需的訓練集數據和測試集數據,全面助推云南香料產業的發展。主要表現在以下3 個方面。
一是構建草果智能預測模型群。在云南省怒江,即科學技術欠發達的地區,提出了在深度學習環境下,采用人工神經網絡算法構建基于智能算法的草果價格預測模型、病蟲害預測模型等多個智能模型,搭建草果產業智能推薦模型群,是解決怒江地區經濟相對落后問題的一種創新思路。
二是推廣應用價值高。本研究構建的智能模型群,不僅適用于草果產業的發展,同樣適用于香料產業中的其他作物,為深入研究香精香料作物的產量、質量、病蟲害等關鍵性問題提供參考。
三是適用人群廣泛、服務能力強。本研究成果不僅適用于種植戶、企業,還適用于相關領域的科研人員。針對智能模型的預測結果,可以為種植戶、企業提供下一季種植品種的類型、種植規模等信息,為研究人員提供研究的數據支撐;針對智能模型收集、整理數據的過程,可以形成大量數據集合,為構建草果產業大數據中心提供數據支撐;針對智能模型的拓展應用,可以為構建模型的企業提供良好的經濟效益,提供大量的低價格、高質量的服務。