







摘要: 提出了一種基于支持向量機預測重工業(yè)經(jīng)濟月度同比增長率的方法。利用2002年以來,我國6年的重工業(yè)月度同比增長率數(shù)據(jù),建立支持向量機預測模型,并對預測結果和實際值進行了比較分析,表明該方法用于經(jīng)濟預測和經(jīng)濟分析是有效的。
關鍵詞:支持向量機;重工業(yè);經(jīng)濟預測
中圖分類號:F201
一、引 言
重工業(yè)在我國經(jīng)濟發(fā)展中占有重要地位,是我國工業(yè)、特別國防工業(yè)發(fā)展的基礎[1-6]。重工業(yè)發(fā)展趨勢預測是一項重要而復雜的工作。準確的預測可以使政府、相關企業(yè)及其他有關部門更好地把握未來經(jīng)濟運行狀況,從而做出有效的經(jīng)濟決策和發(fā)展策略。影響重工業(yè)發(fā)展的因素比較多,例如能源產(chǎn)能、交通物流、資本環(huán)境、環(huán)境保護以及地方政策改變等,它們之間相互影響又相互制約,最終使得重工業(yè)經(jīng)濟系統(tǒng)呈現(xiàn)復雜性、開放性、時態(tài)性、非線性等特點。近年來,國內(nèi)外對于經(jīng)濟預測給出了許多方法。從預測基礎體系而言,經(jīng)濟預測方法大體分為兩類:基于歷史數(shù)據(jù)預測方法和經(jīng)濟理論定性分析預測方法?;跉v史數(shù)據(jù)預測方法主要有回歸分析法、投入產(chǎn)出法、時間序列分析法、遺傳算法、動態(tài)規(guī)劃法等;經(jīng)濟理論定性分析預測方法有:層次分析法、市場調查法、銷售人員估計法等。此外科研工作者亦開發(fā)了多種基于上述方法組合和改進的預測方法。然而,由于經(jīng)濟發(fā)展越來越趨于全球化和多維性,現(xiàn)代重工業(yè)經(jīng)濟發(fā)展已經(jīng)是一種綜合性發(fā)展,傳統(tǒng)預測方法已經(jīng)滿足不了實際預測需求,需要一種兼顧歷史數(shù)據(jù)內(nèi)部關系及經(jīng)濟基礎理論的方法才能夠進行準確地預測。
支持向量機(SVM)最早發(fā)展于分類,20世紀90年代Vapnik等將支持向量機首次應用于回歸問題,是一種介于定量預測與定性分析之間的分類預測方法,在解決小樣本、高維度及非線性問題上優(yōu)勢明顯[7]。SVM方法在許多領域已經(jīng)取得了廣泛應用,例如在指紋識別、人臉識別、字符識別、手寫識別等[8][9][10],SVM算法在準確性上已經(jīng)于傳統(tǒng)的學習方法不分上下。其缺點也很明顯,對于大規(guī)模數(shù)據(jù)處理效率較低,運算時間較長。
本文利用支持向量機能夠同時進行定量和定性處理非線性問題上的優(yōu)勢,較好地進行了非線性經(jīng)濟預測。 利用支持向量機方法分析歷史數(shù)據(jù),預測重工業(yè)同比月增長率,理論預測結果與實際值符合較好。從而從一定程度上說明了支持向量機用于重工業(yè)領域經(jīng)濟預測是有效可行的。
二、基礎理論及模型
SVM理論基礎及預測模型分析如下:
(一) SVM理論基礎
SVM函數(shù)預測,基本思想是通過一個非線性映射,把輸入空間的數(shù)據(jù)映射到高維特征空間中,在高維特征空間中構造線性回歸函數(shù)實現(xiàn)原空間中的非線性回歸問題,最終做出預測。具體算式如下:
算式中系數(shù)ω和b可以由下式來估計求得:
(二) SVM預測模型
通常給定數(shù)據(jù)點集 ,其中 xi是輸入向量,di是期望值,n為數(shù)據(jù)總數(shù)。建立SVM預測模型,實際上,SVM預測也就是方程 的求解過程。根據(jù)相關數(shù)學理論,轉換為如下最優(yōu)化問題:
引入拉格朗日乘子和核函數(shù)后,得到支持向量回歸函數(shù):
具體而言采用SVM進行預測的一般運算流程如圖1所示:
三、基于SVM重工業(yè)經(jīng)濟預測研究
本部分主要介紹了傳統(tǒng)重工業(yè)經(jīng)濟預測模型、指標體系構建及數(shù)據(jù)準備、預測過程、預測結果及分析。
(一) 傳統(tǒng)重工業(yè)經(jīng)濟預測模型
傳統(tǒng)重工業(yè)經(jīng)濟預測模型包括如下幾種,分別是:
1.經(jīng)濟計量模型
以宏觀經(jīng)濟學理論為基礎建立模型,根據(jù)給定的外部變量以及宏觀政策變量預測相關經(jīng)濟量。該模型對于季度、月度預測效果較好,且應用時間廣,但是存在方程組過多運算量巨大,歷史數(shù)據(jù)質量不高的缺點。
2.決策樹法
利用貝葉斯原理,根據(jù)每一可能事件給定概率進行預測。由于事件概率均為人工給定,受人主觀影響干擾較大;且一旦出現(xiàn)未能預估事件,預測結果往往與實際相差甚遠。
3.回歸分析方法
在長期觀察歷史發(fā)展規(guī)律基礎上,分析各種經(jīng)濟現(xiàn)象關系,建立模型來分析預測的方法。重點在于解釋各變量之間的關系,而并不是對于經(jīng)濟進行短期、長期預測。
4.投入產(chǎn)出模型
投入產(chǎn)出模型是基于研究和分析產(chǎn)業(yè)部門之間產(chǎn)品和消耗之間的數(shù)量依存關系進行預測的方法。此種方法應用于產(chǎn)業(yè)部門較多,對于宏觀經(jīng)濟而言,不存在特定的產(chǎn)品和消耗之間的直接制約關系,因此在宏觀經(jīng)濟領域應用具有局限性。
5.銷售人員估計法
銷售人員估計法是將營銷網(wǎng)絡各級銷售預測值自上而下加和統(tǒng)計進行預測的方法。其受銷售人員主觀影響較大,銷售人員往往為了自身利益會對于數(shù)據(jù)進行一定處理,加和統(tǒng)計數(shù)據(jù)誤差較大,數(shù)據(jù)可信度不高。
6.時間序列模型
此方法不以經(jīng)濟理論為依據(jù),根據(jù)歷史數(shù)據(jù)自身變化規(guī)律利用外推機制來描述時間序列的變化。其存在理想假設過多,受經(jīng)濟社會結構影響較大的弊端。
7.專家預測法
將營銷、生產(chǎn)、財務等多方面專家聯(lián)合起來,結合其工作經(jīng)驗和直覺進行預測。此種方法如采取模糊數(shù)學進行處理,預測效果較好,但人為主觀性較大,且耗費人力物力巨大,成本過高。
上述為常見重工業(yè)經(jīng)濟預測的一些方法,優(yōu)勢明顯也有一定的弊端。支持向量機是基于結構最小化原理,通過一個二次規(guī)劃方法,獲得了較高的性能。眾多學者將其推廣到經(jīng)濟預測領域,并取得了較好的效果。本文嘗試其用于重工業(yè)經(jīng)濟預測,力求獲得一種高效的重工業(yè)領域經(jīng)濟預測方法。
(二)指標體系構建及數(shù)據(jù)準備
重工業(yè)是我國經(jīng)濟基礎之一,也是第二產(chǎn)業(yè)的核心之一,其影響因素是多方面的。預測指標體系的構建,力求做到真實全面。由于我國地理原因、季節(jié)因素,如我國地處溫帶,四季氣候變換較大,經(jīng)濟預算決策大多于二月做出,且以五年為經(jīng)濟計劃周期,綜合結合二者因素,且照顧經(jīng)濟連續(xù)性,采用2002-2006年五年的重工業(yè)增長數(shù)據(jù)(具體數(shù)據(jù)值見附件,數(shù)據(jù)來源國家統(tǒng)計局歷年統(tǒng)計數(shù)據(jù))進行合理分析,對于2007年度數(shù)據(jù)進行預測,為經(jīng)濟決策做出依據(jù)。考慮到經(jīng)濟系統(tǒng)的復雜性、多維性,根據(jù)相關分析和文獻參考,建立如下預測指標體系:
表1中季度、月數(shù)及年份均是重工業(yè)影響的主要因素之一,季度由于我國位于溫帶,季節(jié)性氣候變換對于我國重工業(yè)生產(chǎn)有著深刻的影響。用電量是重工業(yè)能源重要來源與投入產(chǎn)出量相關的重要因素。根據(jù)2002-2006年數(shù)據(jù)構造訓練集,建立SVM預測模型,預測2007年重工業(yè)產(chǎn)量同比增加值。
(三) 預測過程
預測過程算法步驟如下:
(1)輸入原始數(shù)據(jù)進行預處理,分別形成訓練集樣本和測試集樣本;
(2)建立SVM模型,參數(shù)初始化,拉格朗日乘子 和 以及閥值b賦予隨機初值;
(3)利用訓練樣本集建立目標函數(shù)(2),求解函數(shù),得到拉格朗日乘子 和 以及閥值b的值;
(4)將求得的參數(shù)值帶入估計函數(shù)(4)中建立預測模型,用測試樣本求得下一年度的預測值;
(5)計算函數(shù)誤差,當誤差小于預先設定值時,結束學習過程,否則,返回繼續(xù)學習
以上學習過程參見圖1。
(四)預測結果及分析
表2、表3預測結果表明,對于不同參數(shù)下相同訓練集,同一參數(shù)下不同訓練集,算法的測試效果有所不同。從預測結果與實際數(shù)據(jù)的偏差可看出,測試集中2007年預測結果都與實際值有偏差,在0.029~0.001之間,誤差范圍為0.083%~3.439%。預測值總體滿足以實際值為中心的正態(tài)分布要求。預測值在一月、十二月誤差均較大,這與我國重工業(yè)企業(yè)絕大部分為國有企業(yè),企業(yè)計劃制定、生產(chǎn)過程推進帶有明顯計劃經(jīng)濟的痕跡。每年一月份為我國制定本年度經(jīng)濟計劃的時段,十二月存在為完成財政計劃突擊支出或收付的特殊情況,政府政策干擾較大,故預測誤差較大。本文作者對于提高預測精度的建議主要有以下兩點:一是利用可行的技術進行聚類分析,將遠離多預測數(shù)據(jù)的預測結果舍棄,對余下的數(shù)據(jù)進行集成集中,將數(shù)據(jù)包含在平均值附近正態(tài)分布區(qū)域內(nèi);二是選擇更好的核函數(shù)(目前選擇的是RBF),可能會得到更加精確的預測值。
四、結論
從上述經(jīng)濟預測結果不難看出,樣本訓練數(shù)據(jù)只采用了近5年60個月度的數(shù)據(jù),所建立SVM的經(jīng)濟預測模型得到的預測結果總體上還是達到了期望值的。如何選擇更好的核函數(shù)和將聚類集成技術更好地應用到經(jīng)濟預測領域,成為未來使SVM方法在經(jīng)濟領域預測具有更廣泛適應性的突破點。論文的研究為小樣本經(jīng)濟預測提供一種新的有效方法。
參考文獻:
[1] 楊叔子,吳雅,等. 時間序列分析的工程應用[M].北京:華中科技大學出版社, 2007.
[2] 周子英,等. 基于PCA-SVM的區(qū)域經(jīng)濟預測研究 [J]. 計算機仿真, 2010,4(28):375-378.
[3] 郭崇慧,等. 宏觀經(jīng)濟預測模型體系研究 [J]. 運籌與管理, 2001,12(4):1-8.
[4] 周鵬,等. 一個中國宏觀經(jīng)濟預測模型及算法 [J]. 大連理工大學學報 ,2003(3):129-132.
[5] 彭珍端,等. 基于支持向量機的鐵路客運量預測 [J]. 遼寧工程技術大學學報, 2007(26):269-272.
[6] 張新紅. 經(jīng)濟時間序列的連續(xù)參數(shù)小波網(wǎng)絡預測模型 [J]. 運籌與管理,2007(4):72-77.
[7] VAPNIK V. The Nature of Statistical Learning Theory[M]. New York:Springer Verlag,1995.
[8] 楊明. 重工業(yè)用電恢復最快,未來電力消費高企 [N].中國工業(yè)報,2010-05-06.
[9] 王信茂. 我國電力供需形勢分析 [J]. 電器工業(yè), 2004(6):23-26.
[10] 葉小榮,等. 基于LS-SVM的經(jīng)濟發(fā)展水平預測 [J]. 統(tǒng)計與決策, 2009(17):33-34.
(編輯:許麗麗)