吳明山,王冰,起亞寧,鄭飄
1 河南中煙工業(yè)有限責(zé)任公司,河南省鄭州市鄭東新區(qū)榆林南路16號 450000;
2 國家煙草專賣局煙草經(jīng)濟信息中心,北京市西城區(qū)月壇南街55號 100045
隨著卷煙營銷模式的不斷深化,卷煙市場逐步由“賣方市場”向“買方市場”轉(zhuǎn)變,消費者擁有越來越多的選擇權(quán),對卷煙銷售工作的挑戰(zhàn)持續(xù)增加,銷量預(yù)測成為提升卷煙營銷水平的一項重要的內(nèi)容。精準(zhǔn)的卷煙預(yù)測,可有效消除卷煙供應(yīng)鏈中的“牛鞭效應(yīng)”,有利于煙草工商企業(yè)高度協(xié)同,提高企業(yè)對卷煙需求的把握能力,準(zhǔn)確判斷需求變化趨勢,提升卷煙按訂單組織貨源水平,加快推動卷煙市場化取向改革。因此,提高卷煙銷量預(yù)測精度對提升卷煙營銷水平具有重大意義。
傳統(tǒng)銷量預(yù)測方法有很多種,例如經(jīng)驗分析、移動平均、指數(shù)平滑、線性回歸等[1],可以一定程度上提高預(yù)測精度,這些方法對樣本數(shù)據(jù)本身有特定的要求(樣本量足夠大或線性相關(guān)),但在實際應(yīng)用中產(chǎn)品銷售的歷史數(shù)據(jù)樣本量有限或不能完全滿足線性規(guī)律,預(yù)測效果會受到較大影響[2]。由于卷煙銷售受季節(jié)性和節(jié)日因素影響較大,呈現(xiàn)出明顯的季節(jié)性、周期性特征,其預(yù)測值往往與卷煙銷售歷史具有高度相關(guān)性,因此時間序列預(yù)測方法更加適合。ARIMA模型就是一種適合數(shù)據(jù)具有穩(wěn)定的季節(jié)性特征的短期預(yù)測方法,具有較強的靈活性[3],為季度或月度卷煙銷量預(yù)測,提供了較好的應(yīng)用價值,預(yù)測結(jié)果較為可靠[4][5]。但由于其對數(shù)據(jù)穩(wěn)定性要求較高,對于非穩(wěn)定的時間序列的中長期預(yù)測精度有待提升。近年來,神經(jīng)網(wǎng)絡(luò)模型因其靈活的非線性建模能力、較強的自適應(yīng)性、學(xué)習(xí)能力和大規(guī)模并行計算能力,被廣泛地應(yīng)用于時間序列預(yù)測研究中[6]。其中,BP神經(jīng)網(wǎng)絡(luò)是應(yīng)用最多的一種。理論證明,當(dāng)隱含層神經(jīng)元數(shù)目足夠多時,可以以任意精度逼近任何一個具有有限間斷點的非線性函數(shù)[7],這一特性使其特別適合于求解內(nèi)部機制復(fù)雜的問題,在銷量預(yù)測中受到廣泛關(guān)注。經(jīng)典BP神經(jīng)網(wǎng)絡(luò)算法是基于梯度下降的學(xué)習(xí)算法[8],具有較強的自適應(yīng)能力和容錯能力,但其收斂較慢、訓(xùn)練時間較長,容易陷入局部最優(yōu),進而影響預(yù)測精度。因此,需要對該方法進行優(yōu)化改進。基于Levenberg-Marquardt算法(LM算法)改進的BP神經(jīng)網(wǎng)絡(luò)就是應(yīng)用最廣泛的方法之一,該算法是用模型函數(shù)對待估參數(shù)向量在其鄰域內(nèi)做線性近似,忽略掉二階以上的導(dǎo)數(shù)項,將優(yōu)化目標(biāo)方程轉(zhuǎn)化為線性最小二乘問題,并利用梯度求最值,同時具有梯度法和牛頓法的優(yōu)點,預(yù)測效果得到進一步提升[9]。蔣興恒等采用基于LM算法改進的BP神經(jīng)網(wǎng)絡(luò)對卷煙月度銷量進行預(yù)測,并與ARIMA預(yù)測結(jié)果進行比較,結(jié)果表明改進后的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測效果更好[10]。
單項的預(yù)測模型具有各自的優(yōu)缺點,只能提取數(shù)據(jù)的部分有效信息,且受設(shè)定條件的影響,預(yù)測精度仍有較大提升空間[11]。于是,J.M.Bates和C.W.J.Granger提出組合預(yù)測方法,該類模型能綜合提取不同預(yù)測方法的有效信息,它可以克服單一模型的局限性,預(yù)測精度得到有效提高[12]。因此,組合模型也開始應(yīng)用于卷煙銷量預(yù)測中。朱俊江等通過建立小波變換、回歸分析和神經(jīng)網(wǎng)絡(luò)算法構(gòu)成的組合模型對鄉(xiāng)鎮(zhèn)單位的卷煙銷量進行預(yù)測,其預(yù)測精度要好于ARIMA模型和基于LM算法改進的BP神經(jīng)網(wǎng)絡(luò)模型[13]。
組合預(yù)測模型的核心有兩個:一是單項預(yù)測模型的選擇,要根據(jù)數(shù)據(jù)的具體特征確定;二是確定各單項模型的權(quán)重,其方法可分為兩類:一類是固定權(quán)重,另一類是動態(tài)權(quán)重[14]。研究表明,動態(tài)權(quán)重組合模型比固定權(quán)重組合模型具有更高的預(yù)測精度[15]。因此,本文根據(jù)卷煙月度銷量數(shù)據(jù)非線性、波動性和規(guī)律性特征,選擇ARIMA模型、基于梯度下降算法的BP神經(jīng)網(wǎng)絡(luò)模型、基于LM算法改進的BP神經(jīng)網(wǎng)絡(luò)模型作為3個單項預(yù)測模型,并利用BP神經(jīng)網(wǎng)絡(luò)對各單項預(yù)測模型進行動態(tài)加權(quán),從而構(gòu)建非線性組合預(yù)測模型,對2006~2017年144個月的全國卷煙銷量進行仿真訓(xùn)練,綜合提取各單項預(yù)測模型的有效信息,以期預(yù)測2018年1~4月的全國卷煙銷量。

圖1 2006~2017年我國卷煙各月銷量趨勢Fig.1 Monthly sales trend of cigarettes in China from 2006 to 2017
ARIMA模型是由Box和Jenkins提出的一種時間預(yù)測方法,該方法將原始時間序列數(shù)據(jù)看作一個隨機序列,并用一定的數(shù)學(xué)模型來近似描述,一旦被識別后,就可以利用該模型根據(jù)歷史數(shù)據(jù)來預(yù)測未來。本節(jié)以2006~2017年共144個月的全國卷煙銷量數(shù)據(jù)(萬箱)作為基礎(chǔ)數(shù)據(jù),如圖1所示,應(yīng)用MATLAB對其進行ARIMA擬合,并預(yù)測2018年1~4月的銷量。
2.1.1 數(shù)據(jù)處理
從銷量趨勢圖中可以看出,該時間序列非平穩(wěn),對數(shù)列先進行1階差分處理,將其平穩(wěn)化,其公式為:

如圖2所示,一階差分的時間序列的均值和方差均基本平穩(wěn),接近一個白噪聲序列。

圖2 差分處理圖Fig.2 Differential processing diagram

圖3 自相關(guān)函數(shù)圖Fig.3 Autocorrelation function diagram
2.1.2 模型識別與定階
通過平穩(wěn)性檢驗可知,即將建立的ARIMA(p,d,q)模型,其中d=1,其基本公式為:

其中,x為時間序列,θ是常數(shù)項,α為自回歸系數(shù),β為移動平均系數(shù),μ為白噪聲,p為自回歸項,q為移動平均項。
為確認模型中p和q的值,以AIC準(zhǔn)則為評價該時間序列數(shù)據(jù)的準(zhǔn)則,利用MATLAB進行測試。本次基礎(chǔ)數(shù)據(jù)為144個,故將p和q的范圍定為1~29之間,通過測試確定AIC=7.06,p=25,q=7,即選擇的模型為ARIMA(25,1,7)。
2.1.3 仿真及預(yù)測結(jié)果
將p和q的值代入模型,計算得到2006~2017年各月卷煙銷量的擬合值(如圖4所示),模型擬合度為76.07%,平均絕對誤差為14.82,平均絕對誤差率(平均絕對誤差/平均真實銷量,下同)為3.81%,擬合精度整體良好。
將預(yù)測長度設(shè)定為4個月,利用該模型對2018年1~4月全國卷煙銷量進行預(yù)測,如表1所示,可以看出預(yù)測誤差均較大,除1月份外,其余3個月的絕對誤差值均大于當(dāng)月的日均銷量。
BP神經(jīng)網(wǎng)絡(luò)是 Rumelhart 和McClellend于 1986年提出一種多層網(wǎng)絡(luò)的“逆推”學(xué)習(xí)算法,是一種單向傳播的多層前向網(wǎng)絡(luò),具有3層或3層以上,包括輸入層、隱含層和輸出層,其中隱含層可以有多個層次,上下層之間的神經(jīng)元全部連接,但每層神經(jīng)元之間相互獨立沒有連接,其結(jié)構(gòu)如圖5所示。當(dāng)學(xué)習(xí)樣本進入神經(jīng)網(wǎng)絡(luò)后,神經(jīng)元的激活值從輸入層經(jīng)過各隱含層傳向輸出層,若達不到期望,則進入誤差反向傳播過程,逐次調(diào)整網(wǎng)絡(luò)各層的權(quán)值和偏置,最后回到輸入層,再重復(fù)計算,通過不斷調(diào)整各層的權(quán)值和閾值,從而達到網(wǎng)絡(luò)誤差最小,學(xué)習(xí)過程結(jié)束;再利用訓(xùn)練好的網(wǎng)絡(luò)進行預(yù)測。
BP神經(jīng)網(wǎng)絡(luò)通過訓(xùn)練誤差來逐步調(diào)整各層間的輸入權(quán)重和偏置,這個調(diào)整過程的算法依據(jù)為最基本的梯度下降法(Gradient Descent),由于訓(xùn)練誤差是關(guān)于輸入權(quán)重和偏置的二次函數(shù),分別對權(quán)重和偏置求偏導(dǎo)數(shù),即梯度向量,沿著梯度向量的方向,是訓(xùn)練誤差增加最快的地方,而沿著梯度向量相反的方向,梯度減少最快,在這個方向上更容易找到訓(xùn)練誤差函數(shù)(損失函數(shù))的最小值。本節(jié)利用MATLAB軟件應(yīng)用梯度下降算法的BP神經(jīng)網(wǎng)絡(luò)對全國卷煙歷史銷量數(shù)據(jù)進行訓(xùn)練并預(yù)測,其處理步驟如下:

圖4 ARIMA模型對2006~2018年4月全國卷煙銷量的擬合及預(yù)測圖Fig.4 The fitting and forecasting of national cigarette sales from 2006 to April 2018 by ARIMA model

表1 ARIMA模型對2018年1~4月全國卷煙銷量預(yù)測表Tab.1 National cigarette sales forecast for January-April in 2018 by ARIMA model萬箱,%,天

圖5 典型BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)Fig.5 Structure of typical BP neural network model structure
2.2.1 樣本數(shù)據(jù)確定
由于卷煙銷量執(zhí)行的是年度計劃,為更好的反應(yīng)卷煙銷量的時間特點,本文將2006至2017年每12個月銷量數(shù)據(jù)作為一組輸入向量,形成12*129的輸入矩陣;以之后4個月的銷量數(shù)據(jù)作為網(wǎng)絡(luò)的輸出,形成4*129的輸出矩陣,用神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練。
2.2.2 樣本數(shù)據(jù)處理
數(shù)據(jù)的預(yù)處理和后處理是訓(xùn)練神經(jīng)網(wǎng)絡(luò)的關(guān)鍵步驟,它直接影響到訓(xùn)練后神經(jīng)網(wǎng)絡(luò)的性能,常見的方法是將原始數(shù)據(jù)進行歸一化處理,即通過一定的線性變換將輸入數(shù)據(jù)和輸出數(shù)據(jù)統(tǒng)一限制在[0,1]或[-1,1]區(qū)間內(nèi)。本節(jié)選擇最大最小法進行處理,其函數(shù)形式是:

其中,xmin為數(shù)據(jù)序列的最小值,xmax為數(shù)據(jù)序列的最大值。最大最小值法可以通過MATLAB的mapminmax函數(shù)對數(shù)據(jù)進行處理,讓其落入在[-1,1]區(qū)間內(nèi)。
2.2.3 創(chuàng)建網(wǎng)絡(luò)及參數(shù)設(shè)定
本模型設(shè)計主要涉及到網(wǎng)絡(luò)的層數(shù)、每層中的神經(jīng)元個數(shù)和激活函數(shù)、初始值以及學(xué)習(xí)速率等幾個方面。
(1)網(wǎng)絡(luò)層數(shù)確定。理論證明,具有偏差和至少一個S型隱層加上一個線性輸出層的網(wǎng)絡(luò),能夠逼近任何有理函數(shù),增加層數(shù)可以進一步降低誤差,提高精度,但同時也使網(wǎng)絡(luò)復(fù)雜化。本節(jié)模型選擇3層網(wǎng)絡(luò),即1個輸入層、1個隱含層、1個輸出層。
(2)創(chuàng)建網(wǎng)絡(luò)。在MATLAB中創(chuàng)建神經(jīng)網(wǎng)絡(luò)要確定以下函數(shù):①輸入層和隱含層的傳遞函數(shù)采用正切S型函數(shù),以tansig表示,即:

②輸出層的傳遞函數(shù)采用線性函數(shù),以purelin表示;③網(wǎng)絡(luò)訓(xùn)練函數(shù)采用動量反轉(zhuǎn)和動態(tài)自適應(yīng)學(xué)習(xí)率的梯度下降算法訓(xùn)練函數(shù)tianingd;④確定隱含層神經(jīng)元個數(shù),理論上沒有計算出多少隱含層節(jié)點最合適,在具體設(shè)計時,要通過對不同神經(jīng)元數(shù)進行訓(xùn)練比較,以網(wǎng)絡(luò)最小誤差為依據(jù)確定神經(jīng)元數(shù)。通過循環(huán)計算,確定此模型的神經(jīng)元個數(shù)為9個。
(3)網(wǎng)絡(luò)訓(xùn)練參數(shù)設(shè)定。①根據(jù)梯度下降法的特點,訓(xùn)練次數(shù)選取為80000;②誤差性能目標(biāo)值選取為0.01;③學(xué)習(xí)速率一般取值范圍為0.01-0.8之間,學(xué)習(xí)速率太大可能導(dǎo)致系統(tǒng)的不穩(wěn)定,但學(xué)習(xí)速率太小導(dǎo)致收斂太慢,需要較長的訓(xùn)練時間,為達到目標(biāo)誤差精度,此模型選取0.01。
2.2.4 仿真及預(yù)測結(jié)果
利用基于梯度下降算法的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型對卷煙銷量數(shù)據(jù)進行訓(xùn)練和仿真,如圖6所示,經(jīng)過79976次訓(xùn)練之后達到目標(biāo)誤差0.01的要求,模型擬合效果如圖7所示,其平均絕對誤差為17.87,平均絕對誤差率為4.59%,其擬合精度不及ARIMA模型。

圖6 基于梯度下降算法的BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練圖Fig.6 BP neural network training diagram based on gradient descent algorithm

圖7 基于梯度下降算法的BP神經(jīng)網(wǎng)絡(luò)對2007~2018年4月全國卷煙銷量的擬合及預(yù)測圖Fig.7 Fitting and forecasting of national cigarette sales from 2007 to April 2018 by BP neural network model based on gradient descent algorithm
輸入2017年12個月的卷煙銷量數(shù)據(jù),模型得到2018年1~4月銷量的預(yù)測值,如表2所示,可以看出雖然該模型擬合效果不及ARIMA模型,但預(yù)測結(jié)果要明顯好于ARIMA模型,除2月份由于春節(jié)因素導(dǎo)致預(yù)測效果較差外,其余月份預(yù)測結(jié)果十分逼近真實銷量,均不足半天的當(dāng)月卷煙銷量。

表2 基于梯度下降算法的BP神經(jīng)網(wǎng)絡(luò)對2018年1~4月全國卷煙銷量預(yù)測表Tab.2 Forecasting of national cigarette sales volume from January to April in 2018 by BP neural network based on gradient descent algorithm萬箱,%,天
從上述基于梯度下降算法的BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練過程發(fā)現(xiàn),雖然該模型能較好的擬合卷煙銷量并比較準(zhǔn)確的預(yù)測未來4個月的銷量,但其學(xué)習(xí)算法的收斂速度較慢,訓(xùn)練次數(shù)達到了近8萬次,另外其預(yù)測誤差精度較低,僅能達到0.01。針對該模型存在的不足,出現(xiàn)了幾種基于該模型的改進算法,如擬牛頓法、Levenberg-Marquardt算法(簡稱LM算法)等。通過實驗發(fā)現(xiàn),對中小規(guī)模的神經(jīng)網(wǎng)絡(luò),使用LM算法的收斂速度最快,且計算精度較高。作為BP神經(jīng)網(wǎng)絡(luò)的改進算法,LM算法實際上是梯度下降法和高斯牛頓法的結(jié)合,該算法期望在不計算Hessian矩陣的情況下獲得高階的訓(xùn)練速度,其公式表達為:

其中,J為雅克比矩陣,e是網(wǎng)絡(luò)誤差向量。隨著 越來越小,該算法越來越接近高斯牛頓法;隨著越來越大,該算法越來越接近梯度下降法。由于高斯牛頓法收斂速度更快更準(zhǔn)確,因此LM算法的目的就是盡快接近高斯牛頓法,如果某次迭代成功,誤差減小,則減小 的值;如果迭代失敗,則增加 的值,從而使得誤差性能函數(shù)隨著迭代的進行而下降到極小值。
2.3.1 基于LM算法改進BP神經(jīng)網(wǎng)絡(luò)模型構(gòu)建
基于LM算法改進BP神經(jīng)網(wǎng)絡(luò)模型的輸入向量和輸出向量與基于梯度下降算法的BP神經(jīng)網(wǎng)絡(luò)模型相同,并進行歸一化的數(shù)據(jù)處理,確定網(wǎng)絡(luò)層數(shù),選擇傳遞函數(shù),設(shè)定訓(xùn)練次數(shù)、訓(xùn)練精度、學(xué)習(xí)速率等參數(shù)。但與前者不同的是,基于LM算法改進的BP神經(jīng)網(wǎng)絡(luò)模型需要將模型的訓(xùn)練函數(shù)更改成LM算法,在MATLAB中以trianlm表示。鑒于LM算法快速、準(zhǔn)確收斂的特點,將模型訓(xùn)練次數(shù)取為3000,誤差性能目標(biāo)值取為0.0005,學(xué)習(xí)速率仍為0.01,經(jīng)過測試神經(jīng)元數(shù)量取為30個。
2.3.2 仿真及預(yù)測結(jié)果
利用LM算法改進BP神經(jīng)網(wǎng)絡(luò)模型對卷煙銷量數(shù)據(jù)進行訓(xùn)練和仿真,如圖8所示,經(jīng)過32次即可達到目標(biāo)誤差0.0005的要求,模型擬合效果明顯更好,如圖9所示。其平均絕對誤差為3.99,平均絕對誤差率為1.03%,其擬合精度明顯高于ARIMA模型和基于梯度下降算法的BP神經(jīng)網(wǎng)絡(luò)模型。

圖8 基于LM算法的BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練圖Fig.8 BP neural network training diagram based on LM algorithm
輸入2017年12個月的卷煙銷量數(shù)據(jù),從而得到2018年1~4月銷量的預(yù)測值,如表3所示,可以看出經(jīng)過改進后的BP神經(jīng)網(wǎng)絡(luò)模型,預(yù)測誤差更加均衡,其預(yù)測效果更加平穩(wěn),適應(yīng)性更強。

圖9 基于LM算法的BP神經(jīng)網(wǎng)絡(luò)模型對2007 ~ 2018年4月全國卷煙銷量的擬合及預(yù)測圖Fig.9 Fitting and forecasting of national cigarette sales from 2007 to April 2018 by BP neural network model based on LM algorithm

表3 基于LM算法的BP神經(jīng)網(wǎng)絡(luò)模型對2018年1 ~ 4月全國卷煙銷量預(yù)測表Tab.3 Forecasting of national cigarette sales forecast for January-April in 2018 by BP neural network model based on LM algorithm萬箱,%,天
上述3種模型均在一定程度上解釋了卷煙銷量數(shù)據(jù)之間的聯(lián)系,并對未來4個月的卷煙銷量進行預(yù)測,但單項預(yù)測方法存在未能充分利用歷史數(shù)據(jù)的缺點,從而導(dǎo)致預(yù)測結(jié)果不夠精準(zhǔn),為此,通過構(gòu)建非線性組合預(yù)測模型,吸收各模型的優(yōu)點,提高預(yù)測精度。
2.4.1 模型構(gòu)建思路
本節(jié)通過基于LM算法改進的BP神經(jīng)網(wǎng)絡(luò)構(gòu)造非線性組合模型,其構(gòu)建思路為:(1)以ARIMA模型擬合值、基于梯度下降算法的BP神經(jīng)網(wǎng)絡(luò)擬合值、基于LM算法的BP神經(jīng)網(wǎng)絡(luò)擬合值作為輸入向量,即選取相同月份的3種模型擬合值作為輸入向量,當(dāng)月真實銷量作為輸出向量,進行訓(xùn)練后進行仿真擬合;(2)輸入上述3種模型對2018年1~4月全國卷煙銷量的預(yù)測值,得到組合預(yù)測模型對銷量的預(yù)測結(jié)果。
2.4.2 模型參數(shù)設(shè)定
對銷量數(shù)據(jù)的訓(xùn)練參數(shù)設(shè)定為:訓(xùn)練次數(shù)取為3000,誤差性能目標(biāo)值取為0.0005,學(xué)習(xí)速率為0.01,經(jīng)過測試神經(jīng)元數(shù)量取為30個。
2.4.3 仿真及預(yù)測結(jié)果
通過訓(xùn)練,組合預(yù)測模型訓(xùn)練的銷量數(shù)據(jù)經(jīng)過4次達到目標(biāo)誤差精度0.0005的要求,如圖10所示,模型擬合效果明顯更好,如圖11所示。其平均絕對誤差為3.3,平均絕對誤差率為0.85%,其擬合精度均高于上述3種模型。

圖10 組合預(yù)測模型的銷量數(shù)據(jù)訓(xùn)練圖Fig.10 Sales data training chart of combined forecasting model

圖11 非線性組合預(yù)測模型對2007~2018年4月全國卷煙銷量的擬合及預(yù)測圖Fig.11 Fitting and forecasting of national cigarette sales from 2007 to April 2018 by nonlinear combination forecasting model
輸入上述3種模型對2018年1~4月銷量的預(yù)測值,利用訓(xùn)練好的模型得到組合預(yù)測模型對2018年1~4月銷量的預(yù)測值,如表4所示,可以看出組合預(yù)測模型的預(yù)測絕對誤差較為均衡,均不足1天的當(dāng)月日均銷量。
對比4種模型的預(yù)測值,發(fā)現(xiàn)各預(yù)測模型呈現(xiàn)不同的特點:ARIMA模型預(yù)測近期銷量相對較準(zhǔn),但較遠月份的預(yù)測值誤差較大;基于梯度下降算法的BP神經(jīng)網(wǎng)絡(luò)模型可以較為準(zhǔn)確的預(yù)測大部分月份的卷煙銷量,但對于波動性較大的月份預(yù)測誤差較大;基于LM算法的BP神經(jīng)網(wǎng)絡(luò)模型作為改進后的神經(jīng)網(wǎng)絡(luò)模型,預(yù)測結(jié)果精度更高,預(yù)測誤差更為平穩(wěn);非線性組合預(yù)測模型綜合利用上述3種模型的優(yōu)點,有效提取數(shù)據(jù)各方面信息,預(yù)測絕對誤差均小于當(dāng)月的日均量,其預(yù)測結(jié)果最為平穩(wěn),適應(yīng)性最強,更加貼合卷煙銷售實際情況。

表4 非線性組合預(yù)測模型對2018年1~4月全國卷煙銷量預(yù)測表Tab.4 Forecasting of the national cigarette sales from January to April in 2018 by nonlinear combination forecasting model萬箱,%,天

表5 四種模型對2018年1~4月全國卷煙銷量誤差值對比Tab.5 Comparison of error values of national cigarette sales from January to April in 2018 by four different models 萬箱,天
本文選擇ARIMA模型、基于梯度下降算法的BP神經(jīng)網(wǎng)絡(luò)模型、基于LM算法改進的BP神經(jīng)網(wǎng)絡(luò)模型作為3個單項預(yù)測模型,并利用BP神經(jīng)網(wǎng)絡(luò)對各單項預(yù)測模型進行動態(tài)加權(quán),從而構(gòu)建非線性組合預(yù)測模型,對2006~2017年144個月的全國卷煙銷量進行仿真訓(xùn)練,并對2018年1~4月的卷煙銷量進行預(yù)測。通過對比表明,非線性組合模型具有更好的預(yù)測效果,對卷煙調(diào)撥計劃制定,科學(xué)安排生產(chǎn)計劃等具有一定的參考意義。此外,該模型的構(gòu)建思路還可用于卷煙各價類的銷售預(yù)測。
同時,在研究過程中,發(fā)現(xiàn)由于春節(jié)及政策的影響,每年1月份的卷煙銷量遠高于其他月份,2月份銷量迅速下降,致使1、2月份的差值非常大,數(shù)據(jù)極具波動性,極易造成預(yù)測誤差。因此,后續(xù)研究中,可以引入月度調(diào)節(jié)因子、政策影響因子等調(diào)整因素,以期進一步提高預(yù)測精度。