梁后軍 謝睿 常郝





摘要:本文以1980-2018年全國棉花產量為基礎使用神經網絡預測未來一年棉花的產量,并外推2019年的全國棉花產量.實驗表明選用的歷史數據過長或過短產生的預測值相對誤差較大,取歷史數據為6,9,12時,2017、2018年預測產量與實際產量相比分別為0.36%及3.6%.預測顯示2019年的產量與2018年基本持平.
關鍵詞:棉花產量;BP神經網絡;預測
中圖分類號:S562? 文獻標識碼:A? 文章編號:1673-260X(2019)07-0073-03
棉花是人民生存發展的基本保障之一,也是一種重要的戰略物資,它關系到國家的經濟繁榮和社會的可持續發展.棉花產量的增減與國民經濟和人民生活息息相關,影響著我國紡織工業原料供應、棉花貿易的發展和棉花產業國際競爭力的強弱.因此,開展棉花生產動態預測具有重要意義.長期以來,我國棉花生產和需求波動較大.供過于求與供不應求、賣棉難與買棉難交替出現的問題,使我國棉花產業陷入一種短缺與過剩的周期波動之中.
只有及時、準確地提供有效的棉花生產與消費的監測預警信息,引導棉花生產、銷售、貯存和加工等產業采取合適的對策,降低棉花產業波動,降低市場風險,保護棉花產業鏈上各方的利益,才能保證棉花產業的可持續發展為保證棉花市場的可持續發展,建立一種可行的棉花產量動態預測模型勢在必行.自20世紀90年代以來,氣象部門就已經開始利用棉花播種前及生長季內的氣象條件來預測棉花產量,并取得了顯著的服務效益.目前,對棉花產量的動態預測方法的研究很多,但大多采用統計學方法,而且時效性較差.
在農業產品預測方面,宗宸生[1]等運用粒子群算法優化BP[2-4]神經網絡的初始權重,建立了適合小樣本糧食產量的預測模型.實驗表明,該模型具有更高的預測精度和較大的適應度.王艷[5]運用卡爾曼濾波算法對新疆棉花產量進行預測,卡爾曼濾波算法的平均預測誤差僅為0.86%,比自回歸滑動平均(ARMA)模型的預測誤差(3.4%)減小了74.34%.由于棉花產業系統具有隨機性、非線性等特點,作為目前應用最成功的神經網絡之一,BP神經網絡的突出優勢在于其具有強大的非線性映射和自適應能力,常用于解決復雜的非線性問題.因而本文以1980—2018年全國棉花產量為基礎使用BP神經網絡預測未來一年棉花的產量,并外推2019年的全國棉花產量,以期為棉花產業的生產、加工及期貨交易等提供依據.
1 神經網絡預測原理
1.1 數據處理
本文以1980—2018年全國棉花產量為基礎使用BP神經網絡預測未來一年棉花的產量,各年產量如圖1所示,雖然存在波動,但總體而言有一個緩慢上升的趨勢.實驗時首先用前面數年的歷史數據和下一年的產量組成輸入-輸出對,對神經網絡進行訓練,再取出最后幾年的歷史數據使用訓練好的神經網絡預測2019年的棉花產量.為測試神經網絡的性能,訓練用歷史數據的長度分年選為3,6,9,12,15,分別表示取前面3年,6年,9年,12年,15年的歷史數據(作為神經網絡的輸入)預測下一年的產量(神經網絡的輸出).從圖中可見所有數據最大值不超過800,為便于神經網絡計算,先將這些數據除以1000,歸一化到區間(0,1)之間.
1.2 神經網絡原理
本文所用BP神經網絡如圖2所示,其中S表示Sigmoid函數.因為Sigmoid函數(簡稱S型函數)處處可導且具有非線性飽和的特性,BP神經網絡一般選用S型函數作為激活函數.S型函數在負無窮端趨于0,正無窮端趨于1,呈非線性飽和特性,中間部分呈線性特性,非常類似生物神經元的信號輸出形式,可增強網絡的非線性映射能力.
2 實驗
實驗分兩組,一組是選出合適的歷史年份數目,即m,第二組是用訓練好的神經網絡預測2019年的棉花產量.
2.1 選擇歷史年份數目
本組實驗也分兩部分.
第一部分是由1980年到2016年的年產量預測2017,2018年的產量并與實際產量進行對比.如表1所示(為便于描述,當歷史年份數m=3,6,9, 12,15時,分別稱對應的方法為“3預測1”“6預測1”等),當m由3變化到15時,相對誤差有一個先減小后增大的趨勢,即m=3,15時預測效果較差.當m=15時,雖然對于訓練中用過的數據產生的平均誤差較小,但預測值的誤差較大,即外推效果較差,因而在預測時只考慮m6,9,12這3種方法得到的結果.從時間方向看,對緊鄰的年份(2017)的預測誤差較小,從表1中可以看出對2017年預測的相對誤差只有0.36%,而對較遠年份(2018)的預測效果較差,相對誤差已經達到了10.81%.對2017年而言,“6預測1”效果最好,相對誤差只有0.36%,實際產量與對應預測值的結果對比如圖3所示,可見二者基本吻合.
第二部分是由1980年到2017年的年產量預測2018年的產量并與實際產量進行對比.同樣可以看出當歷史年份數m=3,15時預測的相對誤差較大,對m=6,9,12時的預測結果取平均,得到的結果較穩定,效果也較好,如表2所示相對誤差是3.60%,是可以接受的.
2.2 選擇歷史年份數目
鑒于m=6,9,12時,三種預測方法的平均值效果穩定、精度也較高,因而采用這三種方法結果的平均值作為最終預測結果.使用1980-2018年的數據對神經網絡進行訓練,預測的2019年的產量見表3,平均預測值為604萬噸,即與2018的產量基本持平.
3 總結與討論
本研究針對棉花產量具有隨機性、非線性難以預測等特點,利用BP神經網絡具有強大的非線性映射和自適應能力,以1980—2018年全國棉花產量為基礎使用神經網絡預測未來一年棉花的產量,并外推2019年的全國棉花產量.
實驗表明選用的歷史數據過長或過短產生的預測值相對誤差較大,取歷史數據為6,9,12時, 2017、2018年預測產量與實際產量相比分別為0.36%及3.6%.預測顯示2019年的產量與2018年基本持平.
參考文獻:
〔1〕宗宸生,鄭煥霞,王林山.改進粒子群優化BP神經網絡糧食產量預測模型[J].計算機系統應用,2018,27(12):203-209.
〔2〕Linyong Cheng, Dongdong Chen,Mingsong Chen, A precise BP neural network-based online model predictive control strategy for die forging hydraulic press machine. Neural Comput & Application, 2016.
〔3〕Jianyong Liu, Huaixiao Wang, Yangyang Sun, et al., Real-Coded Quantum-Inspired Genetic Algorithm-Based BP Neural Network Algorithm[J]. Mathematical Problems in Engineering, 2015: 1-10.
〔4〕李尚平,陳曾雄.BP神經網絡對甘蔗宿根切割質量的預測[J].農機化研究,2018:11-17.
〔5〕王艷.基于卡爾曼濾波算法的新疆棉花產量預測[J].國際紡織導,2018(6):57-61.