吳庚奇, 牛東曉*, 耿世平, 張煥粉
(1.華北電力大學經(jīng)濟與管理學院, 北京 102206; 2.新能源電力與低碳發(fā)展北京市重點實驗室, 北京 102206; 3.北京清暢電力技術股份有限公司, 北京 100089)
隨著市場競爭的不斷加劇,制造企業(yè)面臨的生產(chǎn)、庫存、物流等業(yè)務成本風險增加。企業(yè)想要在競爭脫穎而出,獲得更多的利潤,首先要做好產(chǎn)品需求預測。準確的需求預測是制造企業(yè)擴大市場份額、提高利潤的重要支撐。首先,產(chǎn)品需求預測對制造企業(yè)合理安排生產(chǎn)計劃和物料采購計劃具有導向作用,能夠有效降低產(chǎn)品供應不足風險和庫存成本。其次,制造企業(yè)合理的生產(chǎn)計劃能夠滿足下游分銷商的產(chǎn)品銷售需求,保證其銷售利潤。同時,良好的物料采購計劃保證供應商充足的物料準備時間,有利于供應商有序安排企業(yè)整體的供應計劃。從而有利于維護制造企業(yè)同上下游企業(yè)長期戰(zhàn)略合作的關系,形成企業(yè)間的協(xié)同性發(fā)展,提高市場競爭力,實現(xiàn)多贏。因此,準確的產(chǎn)品需求預測能夠幫助制造企業(yè)更好的管理決策,這對制造企業(yè)及其上下游關聯(lián)企業(yè)都具有重要意義。傳統(tǒng)的產(chǎn)品需求預測往往根據(jù)下游計劃訂單或人工經(jīng)驗,運用統(tǒng)計學等方法進行預測。隨著計算機技術和工業(yè)互聯(lián)網(wǎng)的發(fā)展,計算機算力和數(shù)據(jù)支持都有了長足的進步,基于此構建合理的算法模型能夠有效提高產(chǎn)品需求預測的準確度。
目前,用于產(chǎn)品需求預測的方法主要有統(tǒng)計學方法,如自回歸滑動平均模型(autoregressive moving average model, ARMA)[1],灰色預測模型(grey mo-del, GM)[2]等;智能算法,如人工神經(jīng)網(wǎng)絡(artificial neural network, ANN)[3],支持向量機(support vector machine, SVM)[4]等。李成港等[5]用差分整合移動平均自回歸模型(autoregressive integrated moving average model, ARIMA)對物流公司銷售數(shù)據(jù)進行分析預測,結果表明該模型在短期預測上置信度高,能為倉儲優(yōu)化提供輔助決策依據(jù),解決企業(yè)倉儲不合理等問題。趙軍等[6]應用數(shù)據(jù)挖掘技術建立靈活、準確的預測數(shù)據(jù)庫,將基于指數(shù)平滑模型的庫存需求預測模型應用于第三方物流中心庫存需求預測中,預測效果良好。但當時間序列波動或不穩(wěn)定時,ARMA、ARIMA、指數(shù)平滑等方法的預測效果不夠理想。高豪杰[7]利用反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡模型對閥門制造企業(yè)庫存需求進行預測,結果表明該方法能夠有效降低誤差。但BP神經(jīng)網(wǎng)絡訓練時可能會陷入局部最優(yōu),需要反復進行參數(shù)調(diào)優(yōu),才能取得較好的預測效果。汪婭等[8]提出一種新的基于約束需求預測的消耗性航材備件需求預測方法,通過遺傳算法對其進行求解,獲取最優(yōu)需求預測結果。但遺傳算法的局部搜索能力較差,導致單純的遺傳算法比較費時,在進化后期搜索效率較低。綜上,單一預測模型或多或少存在一些不足,為了優(yōu)化預測模型,組合預測模型應運而生。靖可等[9]提出改進BP-ARIMA組合模型用于預測智能制造模式下產(chǎn)品的不確定性需求,結果表明組合模型的預測精度較ARIMA模型有顯著提高。賈琦等[10]利用灰色模型構建方便、計算簡單、善于挖掘影響因素內(nèi)部聯(lián)系的優(yōu)點,以及LS-SVM在非線性映射分析和穩(wěn)定性高的優(yōu)點,設計了一種灰色LS-SVM預測模型,用于解決小樣本數(shù)據(jù)的裝備器材需求預測問題。采用組合預測能夠結合不同模型的優(yōu)點,有效應對時間序列不平穩(wěn)問題,提高預測速度、降低預測誤差和風險,保證良好的預測效果。然而,目前用于制造企業(yè)產(chǎn)品需求預測的深度學習算法較少。
近些年深度學習的應用掀起熱潮,深度學習是一種利用復雜結構的多個處理層來實現(xiàn)對數(shù)據(jù)進行高層次抽象的算法,以海量的數(shù)據(jù)和計算機算力作為支撐,普遍能夠取得優(yōu)于神經(jīng)網(wǎng)絡的訓練效果[11]。隨著工業(yè)互聯(lián)網(wǎng)的發(fā)展推動了移動互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等與現(xiàn)代制造業(yè)結合,制造企業(yè)也因此有能力提供深度學習足夠的數(shù)據(jù)支持,深度學習算法初步應用于制造企業(yè)的產(chǎn)品需求預測方面。任春華等[12]首先提出一種優(yōu)勢矩陣結合輕梯度提升機(light gradient boosting machine, lightGBM)、門控循環(huán)神經(jīng)網(wǎng)絡(gated recurrent unit,GRU)的組合預測模型用于汽車配件需求預測,該組合模型能夠發(fā)揮2種模型的優(yōu)勢,不僅訓練效率高效且模型結構簡單。Weng等[13]提出了一種基于lightGBM和長短期記憶神經(jīng)網(wǎng)絡(long short-term memory, LSTM)的供應鏈銷售預測模型,實驗結果表明該模型能夠對供應鏈銷售進行準確、高效、可解釋的預測。李瓊等[14]在考慮多產(chǎn)品相互制約的條件下,通過GRU-BP組合神經(jīng)網(wǎng)絡預測模型對模型分析求解后證明預測結果的可行性。基于此,考慮引入當前較為火熱的深度學習算法構建預測模型,豐富深度學習算法在制造企業(yè)產(chǎn)品需求預測等方面的應用,提高預測精度。
近年來,制造企業(yè)在注重供應價值鏈建設,強化自身競爭優(yōu)勢的同時,也開始重視多價值鏈協(xié)同,通過與產(chǎn)品生產(chǎn)銷售中的服務價值鏈、營銷價值鏈等協(xié)同性管理提高整體的運作效率。其中,多價值鏈協(xié)同對于制造企業(yè)產(chǎn)品需求預測意義重大。相比單一供應鏈,多價值鏈協(xié)同能夠獲取更為全面的相關數(shù)據(jù),幫助制造企業(yè)進行供準確的產(chǎn)品需求預測。
通過上述分析,提出一種基于一維卷積神經(jīng)網(wǎng)絡(one-dimensional convolutional neural networks, 1D-CNN)-長短期記憶神經(jīng)網(wǎng)絡的組合預測方法,將其應用于制造企業(yè)的產(chǎn)品需求預測,通過供應鏈、服務鏈、營銷鏈等獲取足夠的多鏈數(shù)據(jù)用于模型訓練,構建出擬合度高的1D-CNN-LSTM模型,從而精準預測產(chǎn)品需求。模型首先采用1D-CNN自動提取歷史產(chǎn)品需求數(shù)據(jù)的深層次特征,接著利用LSTM對數(shù)據(jù)的深層次特征進行處理學習,構建時間序列模型實現(xiàn)產(chǎn)品需求的預測。最后基于某制造企業(yè)產(chǎn)品需求的歷史相關數(shù)據(jù)進行預測,并將模型預測結果同傳統(tǒng)神經(jīng)網(wǎng)絡模型的預測進行比較,分析本文構建模型的有效性。
傳統(tǒng)的制造企業(yè)產(chǎn)品需求預測通常只考慮了單一供應鏈的物料需求、銷售數(shù)據(jù)等情況,沒有考慮到下游代理商的產(chǎn)品售后相關數(shù)據(jù)、產(chǎn)品營銷策略等其他價值鏈中相關因素的影響,預測結果不夠精確。尤其是現(xiàn)在市場環(huán)境復雜,制造企業(yè)的代理商、供應商眾多,供應和銷售渠道增多,企業(yè)間關系愈發(fā)復雜和緊密,產(chǎn)品需求的影響因素越發(fā)復雜,僅單一價值鏈內(nèi)的數(shù)據(jù)難以準確預測。因此,應該從多價值鏈協(xié)同入手,協(xié)同利益相關企業(yè),在大數(shù)據(jù)時代數(shù)據(jù)多且雜的背景下構建數(shù)據(jù)空間,避免大量無用數(shù)據(jù)的干擾,從海量數(shù)據(jù)中收集與產(chǎn)品相關的多鏈數(shù)據(jù)集,用于產(chǎn)品需求預測等相關活動。數(shù)據(jù)空間是以對象為主體,其全生命周期內(nèi)圍繞業(yè)務產(chǎn)生的關聯(lián)數(shù)據(jù)的集合,充分地考慮了如何在最大程度上利用和展現(xiàn)數(shù)據(jù)的有效性及可行性,使得其在打破“數(shù)據(jù)孤島”,推動多源異構數(shù)據(jù)快速融合方面快速確立了領先優(yōu)勢[15]。構建數(shù)據(jù)空間有利于積累信息資源,用于客戶挖掘,物料需求預測、產(chǎn)品需求預測、優(yōu)化物流調(diào)度等方面。例如,本文進行產(chǎn)品需求預測,從產(chǎn)品數(shù)據(jù)空間中獲取多鏈數(shù)據(jù)集,通過全面的數(shù)據(jù)助力預測精度的提高。多價值鏈協(xié)同視角下產(chǎn)品的數(shù)據(jù)空間及數(shù)據(jù)獲取如圖1所示。

圖1 多價值鏈協(xié)同視角下產(chǎn)品的數(shù)據(jù)空間及數(shù)據(jù)獲取
多價值鏈數(shù)據(jù)是由產(chǎn)品需求相關影響因素的相應數(shù)據(jù)構成,主要包括產(chǎn)品全生命周期過程中供應商、制造商、分銷商等鏈上企業(yè)在日常業(yè)務中產(chǎn)生的采購、庫存、銷售、售后等相關信息數(shù)據(jù)[16]。構建預測模型進行產(chǎn)品需求預測,首先需要選取關鍵影響因素作為預測模型的輸入。產(chǎn)品需求變化的驅動因素眾多,全面選擇影響程度大的因素對預測結果的準確性有顯著影響。
在供應鏈環(huán)節(jié)上,供應商、制造商和客戶是產(chǎn)品需求的主要影響主體,分析其中的主要影響因素包括產(chǎn)品零部件的供應量、零部件采購總成本、采購提前期、產(chǎn)品訂單數(shù)量、市場占有率等[17]。在服務鏈環(huán)節(jié)上,產(chǎn)品售后服務過程中的產(chǎn)品退換、三包保養(yǎng)、零部件更換等因素對產(chǎn)品需求也會產(chǎn)生一定的影響。在營銷環(huán)節(jié)上,產(chǎn)品價格、營銷折扣、節(jié)假日和新增客戶數(shù)量也等與產(chǎn)品的銷售情況緊密相關。
CNN是一種包含卷積計算且具有深度結構的前饋神經(jīng)網(wǎng)絡,其基本結構由輸入層、卷積層、池化層、全連接層及輸出層構成[18]。相比傳統(tǒng)神經(jīng)網(wǎng)絡模型,CNN引入感受野機制,具有局部感受野、權值共享和池化的特點,減少了神經(jīng)元連接數(shù)目和訓練參數(shù),從而降低網(wǎng)絡模型復雜度,減少過擬合,獲得較好的泛化能力[19]。CNN模型具有強大的特征識別和提取能力,可以應用于在時間序列數(shù)據(jù)分類上,有效的預測時間序列數(shù)據(jù)的走勢[20]。時間序列預測一般使用1D-CNN模型,其卷積和池化僅在一維尺度上進行,卷積核在時間序列數(shù)據(jù)上進行窗口平移,提取局部序列段與權重進行點乘得到卷積層,進而進行池化下采樣得到池化層,多次反復卷積和池化,提取出時間序列數(shù)據(jù)的關鍵特征,使得預測性能得到優(yōu)化。1D-CNN模型的基本結構如圖2所示。

圖2 1D-CNN的基本結構圖
2.1.1 卷積層
卷積層通過卷積核與輸入數(shù)據(jù)的卷積運算獲取數(shù)據(jù)潛在的特征。其中,卷積核即為濾波器,過濾不重要的信息,抓取數(shù)據(jù)中潛在的重要特征。卷積運算實現(xiàn)了人體的感受野機制,通過局部連接的方式克服了傳統(tǒng)神經(jīng)網(wǎng)絡中全連接方式導致的維度災難,減少了計算量,大幅降低了神經(jīng)網(wǎng)絡模型的訓練難度[21]。卷積運算公式為
(1)
2.1.2 池化層
除了卷積層,CNN也經(jīng)常使用池化層來縮減輸入特征的大小。池化主要通過減少網(wǎng)絡的參數(shù)來減小計算量,提高計算速度,同時提高所提取特征的魯棒性,防止過擬合。池化操作方法一般包括最大池化、平均池化[23],計算公式分別為
(2)
(3)

循環(huán)神經(jīng)網(wǎng)絡(recurrent neural networks,RNN)主要用來處理序列數(shù)據(jù),在預測領域得到了大量的應用。但隨著時間序列長度的增加,由于梯度消失或梯度爆炸問題的存在,傳統(tǒng)的RNN會產(chǎn)生長跨度依賴問題,難以保持長期記憶[24]。LSTM是RNN的一種改進模型,其神經(jīng)單元由輸入門、遺忘門和輸出門構成,通過門決定以往信息和即時信息的記憶程度,解決了長期依賴問題[25]。遺忘門用于決定遺棄多少細胞狀態(tài)中的過去信息和當前信息;輸入門的作用是將有用的新信息加入到細胞狀態(tài);輸出門的作用是從當前狀態(tài)中選擇重要的信息作為細胞狀態(tài)的輸出[26]。LSTM模型的基本結構如圖3所示。

σ為Sigmoid激活函數(shù);xt-1、xt、xt+1為輸入,ht-1、ht、ht+1為輸出;ft為遺忘門,it為輸入門,ot為輸出門;Ct表示當前細胞狀態(tài),表示當前候選細胞狀態(tài);?和⊕表示運算方式
遺忘門、輸入門和輸出門的計算公式為
ft=σ(Wf[ht-1,xt]+bf)
(4)
it=σ(Wi[ht-1,xt]+bi)
(5)
(6)
(7)
ot=σ(Wo[ht-1,xt]+bo)
(8)
ht=ot×tanhCt
(9)
式中:Wf、Wi和Wo分別為遺忘門、輸入門和輸出門的權重矩陣;WC為細胞狀態(tài)的權重矩陣;bf、bi和bo分別為遺忘門、輸入門和輸出門的偏置項;bC為細胞狀態(tài)的偏置項。
1D-CNN可以快速挖掘時間序列數(shù)據(jù)中隱藏的特征,但無法學習到時間序列數(shù)據(jù)中的長依賴特性;LSTM具有較好的長期記憶能力,但對時間序列數(shù)據(jù)隱藏信息的挖掘不如1D-CNN。因此,本文中結合1D-CNN和LSTM兩種模型,首先更好地挖掘出時間序列數(shù)據(jù)深層次的隱藏特征,再進行時間序列預測,聚合兩種模型的優(yōu)勢以提高預測精度。本文構建的1D-CNN-LSTM組合模型的預測流程如圖4所示。

圖4 1D-CNN-LSTM組合模型的預測流程圖
如圖4所示,1D-CNN-LSTM組合模型的及具體實現(xiàn)步驟如下。
步驟1獲取原始數(shù)據(jù),將數(shù)據(jù)預處理后輸入1D-CNN模型;
步驟2輸入數(shù)據(jù)在1D-CNN模型中進行兩次卷積和池化操作,提取數(shù)據(jù)特征;
步驟3將1D-CNN模型處理后得到的特征數(shù)據(jù)集輸入LSTM模型中,進行時間序列預測;
步驟4利用全連接層對將LSTM模型的輸出數(shù)據(jù)進一步處理,最后輸出預測結果。
3.1.1 數(shù)據(jù)獲取
以某電氣設備制造企業(yè)為研究對象,對生產(chǎn)銷售的環(huán)網(wǎng)柜需求進行算例分析。綜合考慮制造企業(yè)供應鏈、服務鏈、營銷鏈對產(chǎn)品需求的影響以及相關數(shù)據(jù)的可獲取性,選取產(chǎn)品價格折扣、產(chǎn)品不合格數(shù)量、節(jié)假日(節(jié)假日及周末為1,正常上班日期為0)、新增客戶數(shù)量作為產(chǎn)品需求預測模型的輸入變量,以銷售數(shù)量作為產(chǎn)品需求量,構建多價值鏈數(shù)據(jù)集,用于產(chǎn)品需求預測。獲取的數(shù)據(jù)為2020年7月6日—2021年7月30日之間的每日數(shù)據(jù)。其中,隨機抽取80%的數(shù)據(jù)集作為訓練集,進行預測模型訓練;以剩下的20%數(shù)據(jù)集作為測試集,對訓練好的模型的預測精度進行檢驗。環(huán)網(wǎng)柜需求相關的部分多鏈數(shù)據(jù)集如表1所示。

表1 環(huán)網(wǎng)柜需求相關的部分多鏈數(shù)據(jù)集
3.1.2 數(shù)據(jù)預處理
從數(shù)據(jù)空間中獲取的多鏈數(shù)據(jù)集需要進行預處理,防止數(shù)據(jù)不規(guī)范、異常等因素對預測結果產(chǎn)生影響,主要處理方式包括缺失值處理、歸一化處理。
(1)缺失值處理。部分數(shù)據(jù)有可能在數(shù)據(jù)空間記錄過程中出現(xiàn)某條數(shù)據(jù)樣本丟失或不全的情況。這些缺失值取前后時刻該特征值的平均數(shù)。
(2)歸一化處理。為了消除數(shù)據(jù)之間的相互影響,讓1D-CNN-LSTM組合預測模型收斂更快更穩(wěn)定,采用min-max法進行歸一化處理,將數(shù)據(jù)映射到[0,1]區(qū)間內(nèi)。歸一化公式為
(10)
式(10)中:xnorm為歸一化處理后的數(shù)值;x為當前的觀測值;xmin和xmax分別為樣本數(shù)據(jù)的最小值和最大值。
3.1.3 實驗環(huán)境
實驗平臺為AMD Ryzen 5 4600U with Radeon Graphics,主頻2.1 GHz,16 G RAM以及Windows 10 64位操作系統(tǒng)。本文中采用Python 3.7構建實驗模型,基于Python的深度學習庫Keras2.0實現(xiàn),Keras以TensorFlow或Theano作為后端,是一個非常方便的深度學習框架。1D-CNN-LSTM模型的超參數(shù)設置在一定程度上會影響預測性能,經(jīng)過反復試驗,確定了相對較優(yōu)的超參數(shù)如表2所示,模型組件的參數(shù)設置如表3所示。

表2 1D-CNN-LSTM模型超參數(shù)設置

表3 1D-CNN-LSTM模型的模型組件參數(shù)設置
對比訓練集和驗證集的損失值和誤差值可以反映模型的擬合能力,因此從訓練集中隨機選取20%的數(shù)據(jù)集作為驗證集對模型進行驗證。本文訓練模型的訓練集和驗證集的損失曲線如圖5所示,訓練集和驗證集的誤差曲線如圖6所示。從圖5和圖6可以看出,隨著訓練次數(shù)的增加,訓練集和驗證集的損失值和誤差值先是快速下降,而后收斂,趨于平穩(wěn),并且損失值和誤差值都收斂于較小的值,反映了本文訓練的CNN-LSTM模型泛化能力較好,擬合程度較高。

圖5 訓練集和驗證集的損失對比

圖6 訓練集和驗證集的誤差對比
利用測試集對訓練好的模型進一步進行性能驗證,圖7為測試集的預測結果。對比預測值和實際值的曲線可以看出,預測值和實際值十分接近,預測精度較高,說明CNN-LSTM模型具有較好的預測能力。

圖7 預測結果對比
選取均方根誤差(root mean square error, RMSE)、平均絕對誤差(mean absolute error, MAE)兩種評價指標來檢驗模型的預測效果,其計算公式為
(11)
(12)
進一步驗證本文構建模型的有效性,分別與LSTM模型、BP模型以及PSO-BP模型進行實驗對比。選取這些模型基于以下幾點考慮:①與LSTM模型進行對比,驗證利用CNN改進的LSTM模型是否能夠通過抓取深層次數(shù)據(jù)特征而提高模型的預測精度;②與BP模型、PSO-BP模型進行對比,驗證深度學習模型的學習能力是否優(yōu)于傳統(tǒng)神經(jīng)網(wǎng)絡模型,能夠訓練出擬合能力更強的預測模型。其中,LSTM模型的參數(shù)設置為:LSTM1神經(jīng)元數(shù)量為128,LSTM1神經(jīng)元數(shù)量為64,Dropout比率取0.2,Dense層1參數(shù)為32,Dense層2參數(shù)為1。BP模型的參數(shù)設置為:隱藏層節(jié)點數(shù)為4,訓練次數(shù)為1 000次,學習率為0.01,最小誤差為0.000 01。PSO-BP模型的參數(shù)設置為:初始種群數(shù)為50,粒子更新位置最大速度為0.9,粒子更新位置最大速度為0.1,隱藏層節(jié)點數(shù)為4。如表4所示為不同模型預測結果的誤差值。

表4 不同模型預測結果的誤差對比
從表4可以看出,LSTM模型的誤差小于BP模型和PSO-BP模型。這說明了相比傳統(tǒng)的神經(jīng)網(wǎng)絡,深度學習網(wǎng)絡在足夠數(shù)據(jù)量的支持下進行深層次的學習擬合,能夠搭建出預測精度更高的預測模型。另外考慮到了數(shù)據(jù)潛在特征的1D-CNN-LSTM模型,則在LSTM模型的基礎上進一步提升了預測精度。
基于多價值鏈協(xié)同視角下制造企業(yè)的產(chǎn)品預測需求,首先提出數(shù)據(jù)空間的概念,構建產(chǎn)品數(shù)據(jù)空間能夠有效整合產(chǎn)品需求變化的所有相關數(shù)據(jù)。當企業(yè)需要進行產(chǎn)品需求預測、物料需求預測等相關活動時,可以簡單高效地從數(shù)據(jù)空間中獲取預測所需的歷史數(shù)據(jù)。其次,引入深度學習算法,提出了1D-CNN-LSTM的預測模型,該模型既能快速挖掘數(shù)據(jù)隱藏的深層次特征,又能長時間記憶歷史數(shù)據(jù)中的信息,能夠有效保證預測精度。最后,利用某電力設備制造企業(yè)的環(huán)網(wǎng)柜銷售相關數(shù)據(jù)對提出的模型進行算例分析,并與其他預測模型進行誤差對比,驗證本文提出模型的預測效果。主要結論如下。
(1)整合企業(yè)生產(chǎn)經(jīng)營活動中產(chǎn)生的所有相關數(shù)據(jù)構建數(shù)據(jù)空間,可以用于產(chǎn)品需求預測、優(yōu)化物流調(diào)度等方面,為企業(yè)的經(jīng)營決策提供依據(jù)。
(2)多價值鏈協(xié)作背景下,綜合考慮多鏈對產(chǎn)品需求的影響進行預測,其預測效果優(yōu)于僅考慮單一供應鏈上的影響因素。
(3)本文構建的1D-CNN-LSTM模型有效,預測精度高、誤差小。其預測效果不僅好于傳統(tǒng)的神經(jīng)網(wǎng)絡模型,也優(yōu)于單一的LSTM預測模型。