吳磊+徐懷伏
摘 要 隨著醫藥企業間的市場競爭加劇,企業銷售管理的重要性逐漸凸顯。醫藥銷售預測是個復雜的非線性系統,為提高企業銷售預測的準確性,本文選取醫藥上市企業處方藥七葉皂苷鈉歷史銷售數據,分別建立ARIMA線性模型和BP神經網絡非線性模型并加以驗證。證明了在銷售預測上采用ARIMA-BP組合模型可以有效降低誤差,為醫藥企業的銷售管理和企業決策帶來新的思路。
關鍵詞 銷售管理 ARIMA模型 BP神經網絡
中圖分類號:F406.69 文獻標識碼:A 文章編號:1006-1533(2016)07-0068-05
Application of ARIMA -BP model in the sales management of the listed pharmaceutical companies
WU Lei, XU Huaifu
(School of International Pharmaceutical Business, China Pharmaceutical University, Nanjing 211198, China)
ABSTRACT The importance of sales management in pharmaceutical enterprises has become increasingly prominent with the intensification of market competition among them. Since the forecast of pharmaceutical sales is a complex nonlinear system, the data of historical sales for sodium aescinate, a prescription drug from the listed pharmaceutical companies were selected, and an ARIMA linear model and a BP network nonlinear model were established and verified based on the theory of linear and nonlinear prediction in order to improve the accuracy of sales forecast. It is proved that adoption of a combination of two models can effectively reduce errors and bring in some new ideas for the sales management and policy decision of pharmaceutical enterprises.
KEY WORDS sales management; ARIMA model; BP neural network
隨著經濟全球化以及市場競爭的加劇,銷售管理工作逐漸成為企業管理工作的核心。目前,我國醫藥企業銷售管理工作中存在銷售預測脫離實際,預測主觀性較強,缺乏科學的方法等問題。準確的藥品銷售預測不但可以指導生產、銷售工作來防范風險,還是科學的銷售績效指標的重要前提條件。隨著現代理論以及數據挖掘工具的發展,銷售預測和實際數據吻合將成為現實。由于藥品銷售數據實際是非線性、時變的時間序列數據,本文通過對醫藥上市企業歷史銷售數據的分析,建立ARIMA模型,預測結果作為線性預測能力,同時建立BP神經網絡模型,預測結果作為非線性擬合能力,將兩者結果通過權值來組合模型進行預測,提高了藥品銷售預測的準確率,為我國醫藥企業優化藥品銷售決策方案提供新思路
1 藥品銷售預測理論概述
1.1 銷售預測
藥品銷售預測是根據藥品的歷史銷售數據和企業發展戰略,充分考慮市場需求、市場環境、醫藥政策等因素,對未來市場進行定量預測,并有合理的預見結論。
現代理論中,運用較多的數據挖掘工具是回歸分析、聚類、關聯分析以及神經網絡等,已在預測財政收入、價格、需求量、銷售量上有廣泛應用。歷史研究表明,單一預測模型都有自身的局限性,于是出現組合模型方法,例如賴紅松等[1]運用灰色神經網絡組合模型預測人口數量,并獲得精確的預測效果;劉明鳳等[2]提出一種改進的卡爾曼濾波混合預測模型將 ARIMA 模型和BP神經網絡模型相結合,大大減小預測誤差并且改善預測結果的延遲現象;李眉眉[3]對比標準BP神經網絡模型和混沌線性回歸模型的預測結果,表明基于混沌分析的BP神經網絡模型的預測精度較高。
銷售預測的標準就是準確性,影響銷售預測的因素很多,包括人為因素、市場與競爭環境、政策變化、季節變化等。時間序列預測方法考慮影響因素之間的線性關系,運用ARIMA模型得出線性預測結果;BP神經網絡模型可把周期因素、市場活動、季節等非線性影響因素的相互作用以權值形式固化在網絡中,運用訓練得到的BP神經網絡模型得到非線性預測結果。
1.2 數據來源
A是一家以研發為基礎的醫藥上市公司,專注于天然藥物、新型制劑和生物技術產品的研發、生產和銷售。本文數據來源于A醫藥上市公司2008—2014年處方藥七葉皂苷鈉的銷售數據,建立預測模型時用2010年1月—2014年6月的銷售數據為樣本(表1),用2014年7月—12月的數據來檢驗模型預測的準確度。
2 ARIMA-BP組合預測模型應用
2.1 ARIMA模型預測的建立
差分自回歸移動平均模型(auto-regressive integrated and moving average model, ARIMA),是一種能很好地預測線性變化的時間序列模型,它由自回歸和移動平均兩步法構成。ARIMA模型理論上適合于各種時間序列數據,它不需對時間序列的發展模式作先驗的假設,可通過反復識別修改,直到獲得滿意的模型,是一種理論較完善、精確度較高的時序短期預測方法。在醫藥行業,ARIMA模型已用在發病預測、藥品費用預測、醫院績效預測以及藥品銷售預測等領域。其表達式為:
2.1.1 樣本序列特點及平穩化處理
ARIMA模型的假設基礎是平穩時間序列,如果時間序列是有趨勢的,那么一定是非平穩數據。 如果時間序列非平穩,建立模型之前應先通過差分把它變換成平穩的時間序列。運用Eviews 3.1軟件繪制2010年1月—2014年6月銷售額時序圖顯示,此藥品銷售額有明顯上升的長期趨勢(圖1),因此該序列是非平穩序列。對原時間序列y取對數消除異方差以及進行一階差分得到平穩數列y*,圖像在零附近波動(圖2)。
本文運用單位根檢驗 (augmented dickey-fuller test,ADF)對時間序列進行平穩性檢驗,檢驗結果如表2,ADF小于各臨界值,序列y*通過平穩性檢驗。
2.1.2 ARIMA(p,d,q)模型定階及參數估計
利用Eviews 3.1軟件,觀察平穩后序列的顯著特征就是自相關函數隨時間間隔的增大而衰減。自相關系數從第一階開始下降,先設定的q值可為1;同理,偏自相關函數設定p的值可為2、3、4。模型合理的滯后階數通常采用AIC信息準則,根據AIC最小原則以及似然函數值越大原則,表3比較結果顯示,p=2,q=1時的AIC值最小,且大部分參數檢驗都顯著,確定模型為ARIMA[(2,1,1),(表4)]。
2.1.3 模型估計和檢驗
模型的殘差序列必須通過卡方檢驗。時間序列的殘差得到如果是白噪聲序列,說明時間序列中有用的信息已被提取完畢,剩下的是隨機擾動,無法預測和使用,此時建模完成;若殘差不是白噪聲,p值很小就說明殘差存在相關性,其中還有有用的信息,模型需要修正[4]。當時間序列通過白噪聲檢驗后,就可以檢驗序列是否通過Q-統計量檢驗。如果殘差不存在序列相關,在各階滯后的自相關和偏自相關值都接近于0,所有的Q-統計量都不顯著且其p值都大于既定值。
利用Eviews軟件中得到對模型ARIMA(2,1,1)進行白噪聲檢驗的結果,隨著滯后期的增加,Q-統計量的值都低于5%顯著性水平臨界值27.58,并且Q-統計量的P值大于顯著性水平5%,說明在5%的顯著性水平下,接受殘差序列為白噪聲序列的原假設,殘差序列不存在序列相關,表明模型對序列的信息已經提取充分,所以可以確定ARIMA(2,1,1)為平穩序列y*的最佳預測模型。
2.1.4 ARIMA模型的確定
采用TIC、BP、VP、CP值檢驗模型預測精度,其中BP、VP、CP和為1。擬合值和真實值差異小的話要滿足:TIC值接近于0,而CP占BP、VP、CP三者和的比重大。靜態預測圖中實線代表的是預測值,兩條虛線提供的是2倍標準差的置信區間,隨著預測時間的增加,預測值很快趨向于序列的均值,其中TIC為0.35,BP和VP比例很小,CP為0.8占比較大,說明實際序列波動較大,而模擬序列的波動較小,可以判斷2014年銷售量的預測是較為準確的。
最終確定線性預測模型ARIMA(2,1,1)的具體形式為:
2.2 BP神經網絡模型的建立
BP神經網絡稱作誤差反傳訓練人工神經網絡,作為一種非線性、具有統計特性的數據挖掘技術,對于連續數值類型數據輸出的預測能力,在商業領域、自然科學和社會科學領域得到持續增長的應用。根據Kolrnogorov定理,由輸入層、隱含層和輸出層組成的BP神經網絡能夠實現對任意非線性函數進行逼近,可實現從輸入狀態到輸出狀態的非線性映射。每層由神經元組成,相鄰層各個神經元之間形成完全連接關系,且同層內各個神經元之間形成完全不連接關系,利用輸入與期望之間的誤差作為信號,進行多次調節至誤差最小,適用于無規則、多約束或殘缺數據問題的研究,具有強容錯性、強自適應性和強映射能力等優點。在醫藥行業,BP神經網絡的應用大致可以分為采購資金管理、醫療器械和材料的需求以及藥品銷售預測等,如今還有藥品價格預測、醫藥企業績效評價、藥品療效評價等多方面領域的應用,熊堯等[5]將BP神經網絡運用于醫療機構的基本藥物需求預測中,為保證采購數量科學化和采購理論方法提供借鑒。神經網絡模型中,輸出yt和輸入yt 1?,yt 2?,…之間的關系如下:
2.2.1 準備訓練數據,樣本數據歸一化
2.2.2 設置訓練網絡結構和參數
利用MatlabR 2012a得到歸一化后的藥品時間序列銷售額數據,經過多次實驗確定將前3個月的銷售數據為輸入節點,第4個月銷售數據作為輸出節點,2008—2013年每月數據作為分析對象,2014年數據作為測試樣本。網絡輸入層是3個神經元,輸出層是1個神經元。
通過多次網絡訓練,確定最優訓練網絡參數為:1)訓練最大循環次數(trainParam.epochs)為1 000。2)訓練目標誤差(trainParam.goal)為0.001,學習速率(trainParam.lr)為0.1,通常較低的學習率需要較多的訓練迭代。
3)激活函數的確定:訓練函數為LM自適應調整訓練函數,隱含層采用雙曲正切S型函數,輸出層采用線性傳遞函數,S型函數具有非線性放大系數功能,一般輸出層不用S型函數,因為這樣輸出就會被限制在較小范圍內,通常使用線性函數。
4)隱含層神經元個數取5,隱含層數較少會使訓練網絡收斂較慢。
構建的BP神經網絡在Matlab中的語句為net=newff
(inputn,outputn,5,{tansig,purelin},trainlm)。
采用均方誤差(mean squared error,MSE)作為檢驗模型擬合效果的評價標準,MSE的值越小,說明預測模型描述實驗數據具有更好的精確度[6]。經過34次訓練,在迭代53次后達到預期目標誤差,其中在第47次迭代時達到0.000 158 78。用訓練得到的網絡進行預測,輸入2013年10—12月的數值得到2014年1月的預測值,以此類推得到2014年剩下月的預測值。
2.3 ARIMA-BP組合預測模型


對比結果發現,BP神經網絡預測的精準度比ARIMA模型高,組合模型的預測精度高于單獨使用一種模型,除了個別月存在偶然因素外,平均誤差的范圍都在10%以內,具有預測有效性(表5)。
3 結語
藥品銷售額是由很多復雜的因素共同影響,建立一個模型將這些因素都考慮并準確預測銷售實際上是非常困難的。為提高銷售預測的準確性,本文將兩種預測模型組合起來進行預測,比單獨一種模型提高了預測精度。由于歷史銷售數據通常是非線性的時間序列,可以分解成由線性和非線性兩部分組成,確定兩種預測模型的權值系數后得到的組合模型不僅克服了單純采用ARIMA模型預測非線性時間序列精度低的問題,也克服了單獨使用BP神經網絡模型陷入局部極小值、收斂速度慢的不足,同時還借鑒人為的主觀經驗判斷,為企業的生產、經營和銷售決策提供了科學的方法和有力的參考依據。然而實際中,應當靈活地將定量和定性分析相結合,進行組合時重要的是要選取適合企業的衡量標準來確定權值系數,在數據預測模型的基礎上綜合考慮各種因素,這樣才能實現對藥品銷售更為精準的預測。
實際應用中,一個有效的銷售預測不應該只有預測的數據,同時應該更新實際銷售數據以及保留原有預測的數據。每次企業進行銷售預測應該同時考慮:①對已經發生的時間段,比較實際銷售與預測數據的差異;②對未來的預測時間段,比較更新的數據和原有預測數據之間的差異;③更新的預測數據與過去實際的銷售數據之間的差異。
參考文獻
[1] 賴紅松, 祝國瑞, 董品杰. 基于灰色預測和神經網絡的人口預測[J]. 經濟地理, 2004, 24(2): 197-201.
[2] 劉明鳳, 修春波. 基于ARMA 與神經網絡的風速序列混合預測方法[J]. 中南大學學報(自然科學版), 2013, 44(1): 16-20.
[3] 李眉眉, 丁晶, 覃光華. 基于混沌分析的BP神經網絡模型及其在負荷預測中的應用[J]. 四川大學學報(工程科學版), 2004, 36(4): 15-18.
[4] 張華初, 林洪. 我國社會消費品零售額ARIMA預測模型[J]. 統計研究, 2006, 23(7): 58-60.
[5] 熊堯, 李智慧, 楊家欣, 等. 基于BP神經網絡在基本藥物采購量短期預測中的研究[J]. 上海醫藥, 2013, 34(5): 47-51.
[6] 盛魁. RBF神經網絡在藥品銷售預測中的應用[J]. 長江大學學報(自科版), 2013, 10(19): 65-67.