摘 要:農(nóng)產(chǎn)品物流雖然具有普通物流的共同特點(diǎn),但因其具有獨(dú)特性和復(fù)雜性,這導(dǎo)致利用一般方法進(jìn)行農(nóng)產(chǎn)品物流需求預(yù)測(cè)不僅難度大,而且精度差。為了提高農(nóng)產(chǎn)品物流需求預(yù)測(cè)的能力,應(yīng)用基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則的標(biāo)準(zhǔn)支持向量機(jī)回歸方法來(lái)研究農(nóng)產(chǎn)品物流需求預(yù)測(cè)問(wèn)題。在選擇適當(dāng)?shù)膮?shù)和核函數(shù)的基礎(chǔ)上, 通過(guò)對(duì)實(shí)例研究,對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測(cè),發(fā)現(xiàn)該方法能獲得最小的訓(xùn)練相對(duì)誤差和測(cè)試相對(duì)誤差。結(jié)果表明,支持向量機(jī)回歸是研究農(nóng)產(chǎn)品物流需求預(yù)測(cè)的有效方法。
關(guān)鍵詞:支持向量機(jī)回歸農(nóng)產(chǎn)品物流需求預(yù)測(cè)模型
中圖分類(lèi)號(hào):F2文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1674-098X(2011)09(a)-0148-02
1引言
農(nóng)產(chǎn)品物流對(duì)于國(guó)民經(jīng)濟(jì)的發(fā)展及公民生活水平的提高至關(guān)重要,準(zhǔn)確把握、預(yù)測(cè)農(nóng)產(chǎn)品物流需求有助于制定合理的農(nóng)產(chǎn)品物流規(guī)劃、促進(jìn)國(guó)民經(jīng)濟(jì)可持續(xù)發(fā)展、提高公民生活水平。近年來(lái),國(guó)內(nèi)外很多學(xué)者在物流需求預(yù)測(cè)上,提出了很多有創(chuàng)新性和實(shí)踐意義的方法。如,基于線性回歸模型的物流需求預(yù)測(cè)[1]、基于時(shí)間序列模型在物流需求預(yù)測(cè)中的應(yīng)用[2]、基于灰色-馬爾科夫鏈的區(qū)域物流需求預(yù)測(cè)[3]、基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則人工神經(jīng)網(wǎng)絡(luò)[4]方法。支持向量機(jī)是近幾年來(lái)應(yīng)用于建模的一種新的學(xué)習(xí)方法。支持向量機(jī)算法最終將轉(zhuǎn)化為一個(gè)二次型尋優(yōu)問(wèn)題,從理論上講得到的將是全局最優(yōu)點(diǎn),支持向量機(jī)的拓?fù)浣Y(jié)構(gòu)由支持向量決定,避免了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)需要經(jīng)驗(yàn)試湊方法確定,而且SVM的最優(yōu)求解基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化思想,因此具有比其他非線性函數(shù)逼近方法具有更強(qiáng)的泛化能力。
本文就是根據(jù)支持向量機(jī)模型對(duì)樣本限制少,能進(jìn)行小樣本、多因素的非線性分類(lèi)的特點(diǎn),采用支持向量機(jī)模型(選用v-SVR和RBF核函數(shù))對(duì)農(nóng)產(chǎn)品物流需求進(jìn)行預(yù)測(cè)。最后通過(guò)測(cè)試,驗(yàn)證了利用支持向量機(jī)模型建立的需求預(yù)測(cè)模型能較好地實(shí)現(xiàn)農(nóng)產(chǎn)品物流需求的預(yù)測(cè),并取得了較好的效果。
2支持向量機(jī)解決回歸問(wèn)題的基本原理
支持向量機(jī)最初是由Vapnik提出的一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)算法,相對(duì)于神經(jīng)網(wǎng)絡(luò)的啟發(fā)式學(xué)習(xí)方式和實(shí)現(xiàn)中帶有的很大的經(jīng)驗(yàn)成份相比,SVM具有更嚴(yán)格的理論和數(shù)學(xué)基礎(chǔ),支持向量機(jī)其基本思想就是把訓(xùn)練數(shù)據(jù)集從輸入空間非線性地映射到一個(gè)高維特征空間(Hilbert空間),然后在此空間中求解凸優(yōu)化問(wèn)題(典型二次規(guī)劃問(wèn)題),可以得到全局最優(yōu)解,支持向量機(jī)在最小化經(jīng)驗(yàn)風(fēng)險(xiǎn)的同時(shí)最小化置信風(fēng)險(xiǎn),有效地保證了較強(qiáng)的推廣特性且推廣能力可以得到方便的控制。采用核函數(shù)方法將輸入空間映射到一個(gè)高維內(nèi)積空間中,有效地避免了“維數(shù)災(zāi)難”。支持向量機(jī)調(diào)整參數(shù)少,且模型結(jié)構(gòu)由最能提供信息特征的支持向量點(diǎn)反映,可以大大降低建模的復(fù)雜性。
3支持向量機(jī)的標(biāo)準(zhǔn)模型
3.1 線性支持向量機(jī)回歸
線性回歸問(wèn)題就是給定一個(gè)新的輸入樣本x,根據(jù)給定的數(shù)據(jù)樣本推斷它所對(duì)應(yīng)的輸出y是一個(gè)實(shí)數(shù),對(duì)于應(yīng)用SVM解決回歸問(wèn)題時(shí),數(shù)學(xué)表述如[5]:
給定的樣本數(shù)據(jù)集合為。其中,,。尋找上的一個(gè)函數(shù),可以用y=來(lái)推斷任意輸入x所對(duì)應(yīng)的y值。設(shè)樣本數(shù)據(jù)為n維向量,某區(qū)域的1個(gè)樣本及其值的表示為: (1)
線性函數(shù)設(shè)為:(2)
優(yōu)化問(wèn)題及最小化為: (3)
約束條件為:;(4)
;(5)
,(6)
. . . . . .
可以得到優(yōu)化問(wèn)題的對(duì)偶形式最大化函數(shù)為:
(7)
其約束為: (8)
和; (9)
解公式得到拉格朗日乘子則回歸方程公式(2)中的系數(shù)為:
(10)
3.2 非線性支持向量機(jī)回歸
非線性回歸與線性回歸類(lèi)似,區(qū)別在于要首先使用一非線性映射把數(shù)據(jù)映射到高維特征空間,再在高維特征空間進(jìn)行線性回歸。其關(guān)鍵問(wèn)題在于核函數(shù)的使用。這里,目標(biāo)函數(shù)轉(zhuǎn)化為:
(11)
此時(shí): (18)
預(yù)測(cè)函數(shù)可以直接表示為: (12)
式中為核函數(shù)可以有不同的形式,如高斯徑向基核、多項(xiàng)式核、指數(shù)徑向基核、多成感知核、樣條核等。
公式(19)中的b值可以根據(jù)公式(20)和(21)得到。
(13)
(14)
4 基于支持向量機(jī)的農(nóng)業(yè)物流需求量預(yù)測(cè)模型的構(gòu)造步驟
4.1 確定影響因素和數(shù)據(jù)樣本
本文的預(yù)測(cè)目標(biāo)是國(guó)內(nèi)農(nóng)產(chǎn)品物流需求量,即對(duì)未來(lái)年農(nóng)產(chǎn)品物流需求量進(jìn)行預(yù)測(cè)。而影響預(yù)測(cè)目標(biāo)的因素為預(yù)測(cè)指標(biāo),各預(yù)測(cè)指標(biāo)數(shù)據(jù)將作為學(xué)習(xí)樣本X的分量,預(yù)測(cè)指標(biāo)的選擇是建立預(yù)測(cè)模型過(guò)程中關(guān)鍵性的一步,它將直接影響到預(yù)測(cè)結(jié)果的準(zhǔn)確性。本文將直接引用參考文獻(xiàn)[4]中的數(shù)據(jù)指標(biāo)。
假設(shè)表示第t年的農(nóng)產(chǎn)消費(fèi)品零售總額(億元)、表示第t年農(nóng)林牧漁業(yè)產(chǎn)值(億元)、表示第t年糧食產(chǎn)量(萬(wàn)噸)、表示第t年農(nóng)村居民均收入(元)、表示第t年國(guó)家財(cái)政用于農(nóng)業(yè)的支出(億元)。表示相關(guān)經(jīng)濟(jì)指標(biāo)影響決定下的農(nóng)產(chǎn)品物流需求規(guī)模,則用方程可表示為:;式中,為支持向量機(jī)的預(yù)測(cè)函數(shù)。
4.2 整理樣本數(shù)據(jù)
建立樣本數(shù)據(jù)集,數(shù)據(jù)集中包含1個(gè)數(shù)據(jù)組,,,代表預(yù)測(cè)指標(biāo)數(shù)據(jù),指標(biāo)構(gòu)成的n維向量,與輸入對(duì)應(yīng)的輸出Yi為預(yù)測(cè)對(duì)象,即第年的農(nóng)產(chǎn)品物流需求量。
將整理好的數(shù)據(jù)用那個(gè)本集分成幾組,將1991~2002年的樣本數(shù)據(jù)作為訓(xùn)練集,剩下的數(shù)據(jù)組作為預(yù)測(cè)對(duì)象,經(jīng)過(guò)多次訓(xùn)練后確定最佳模型參數(shù),然后根據(jù)非線性支持向量機(jī)回歸的原理構(gòu)造并求解凸二次規(guī)劃問(wèn)題。
實(shí)驗(yàn)中為了使小的數(shù)據(jù)不被大的數(shù)據(jù)所淹沒(méi),方便計(jì)算減少誤差,所有屬性指標(biāo)都?xì)w一化處理.實(shí)驗(yàn)根據(jù)軟件libsvm-2.89的要求,采用svm-scale.exe將數(shù)據(jù)歸一化到[-1,1]。
4.3 核函數(shù)及參數(shù)的確定
研究中,選擇徑向基(RBF)作為SVM模型的核函數(shù),因?yàn)镽BF 核函數(shù)是一個(gè)應(yīng)用較為廣泛的核函數(shù),通過(guò)參數(shù)的選擇,它可以適用于任意分布的樣本。并且RBF核的計(jì)算難度較小。
在模型訓(xùn)練之前需要確定三個(gè)參數(shù),分別為懲罰系數(shù)C、模型參數(shù)v,以及核函數(shù)參數(shù)。對(duì)歸一化后的數(shù)據(jù)進(jìn)行網(wǎng)格交叉驗(yàn)證試驗(yàn)[6],即把已知數(shù)據(jù)分成幾組,以其中部分?jǐn)?shù)據(jù)組為預(yù)測(cè)對(duì)象,其余的數(shù)據(jù)組用作訓(xùn)練集,根據(jù)預(yù)測(cè)結(jié)果的好壞來(lái)選擇參數(shù)。實(shí)驗(yàn)采用libsvm-2.89中的gridregression.py進(jìn)行參數(shù)尋優(yōu),縮小參數(shù)尋優(yōu)的范圍,再通過(guò)不斷變換參數(shù),進(jìn)行交叉對(duì)比實(shí)驗(yàn)測(cè)試,最后選取的訓(xùn)練參數(shù)為:C=1024,v=0.0125,σ=2。
4.4 模型的訓(xùn)練與預(yù)測(cè)
根據(jù)已知指標(biāo)數(shù)據(jù)和構(gòu)造的預(yù)測(cè)模型,將樣本集劃分為兩部分。選擇1991~2002年對(duì)應(yīng)的12組樣本數(shù)據(jù)作為訓(xùn)練集,用于模型訓(xùn)練、參數(shù)選擇;剩余2003~2005年的3組樣本數(shù)據(jù)作為測(cè)試集,用于預(yù)測(cè)結(jié)果的對(duì)比分析。實(shí)驗(yàn)利用libsvm~2.89中的svm-train和svm-predict進(jìn)行模型訓(xùn)練和預(yù)測(cè),最后得出預(yù)測(cè)結(jié)果與實(shí)際值對(duì)比分析,2003-2005年的預(yù)測(cè)值分別是11073600、12334200、12754600,實(shí)際值分別為11261100、11970100、12748100,經(jīng)計(jì)算得到誤差分別為0.01665、0.02952、0.00051。
4.5 模型精度的檢驗(yàn)
利用性能評(píng)價(jià)指標(biāo)預(yù)測(cè)誤差,平均誤差,均方根誤差和預(yù)測(cè)準(zhǔn)確度的計(jì)算公式,可以得到、和分別為:0.01566、0.03452、96.515%,由此可見(jiàn),選用基于支持向量機(jī)回歸的農(nóng)產(chǎn)品物流需求量預(yù)測(cè)模型其預(yù)測(cè)準(zhǔn)確率可以達(dá)到96.515%,能夠有效地預(yù)測(cè)農(nóng)產(chǎn)品物流需求量將來(lái)值。
5結(jié)語(yǔ)
本文以文獻(xiàn)[4]的數(shù)據(jù)作為實(shí)例,運(yùn)用支持向量回歸機(jī)對(duì)農(nóng)產(chǎn)品物流需求量做預(yù)測(cè),并取得滿(mǎn)意的結(jié)果。支持向量回歸機(jī)具有很強(qiáng)的學(xué)習(xí)性、自適應(yīng)性,且收斂快、準(zhǔn)確性高,說(shuō)明支持向量機(jī)回歸預(yù)測(cè)模型能夠比較準(zhǔn)確地將有關(guān)的宏觀經(jīng)濟(jì)數(shù)據(jù)與農(nóng)產(chǎn)品物流需求量結(jié)合,從而可得到較為精確的農(nóng)產(chǎn)品物流需求預(yù)測(cè)值。為此可以推斷,支持向量機(jī)回歸模型將在物流領(lǐng)域中的應(yīng)用具有更加廣泛的發(fā)展?jié)摿ΑT摲椒ǖ娜秉c(diǎn)是預(yù)測(cè)原理較復(fù)雜,預(yù)測(cè)過(guò)程需要專(zhuān)門(mén)的軟件,需要進(jìn)行多次訓(xùn)練方能得到合適的參數(shù)。
參考文獻(xiàn)
[1]方威,肖衡,任湘郴.基于線性回歸模型的物流需求預(yù)測(cè)[J].生產(chǎn)力研究,2009(12)94~96.
[2]田根平,曾應(yīng)昆.基于時(shí)間序列模型在物流需求預(yù)測(cè)中的應(yīng)用[J].現(xiàn)代物流技術(shù),2007(9)96~99.
[3]黃敏珍,馮永冰.基于灰色-馬爾科夫鏈的區(qū)域物流需求預(yù)測(cè)[J].統(tǒng)計(jì)與決策,2009(16)166~168.
[4]王新利,趙琨.基于神經(jīng)網(wǎng)絡(luò)的農(nóng)產(chǎn)品物流需求預(yù)測(cè)研究[J].農(nóng)業(yè)技術(shù)經(jīng)濟(jì), 2010(2):62~68.
[5]白鵬,張喜斌,張斌,李彥,謝文俊,劉君華.支持向量機(jī)理論及工程應(yīng)用實(shí)例[M].西安:西安電子科技大學(xué)出版社.2008,53~57.
[6]林升梁,劉志.基于RBF核函數(shù)的支持向量機(jī)參數(shù)選擇[J]浙江工業(yè)大學(xué)學(xué)報(bào),2007:35(4):163~167.