鄧必年



摘 要: 孤立點對物流成本預測結果具有干擾作用,而當前模型均沒有考慮孤立點的負面影響,預測結果可信度低。為了改善物流成本的預測效果,提出基于剔除孤立點的物流成本預測模型。首先對當前物流成本預測研究現狀進行分析,并根據密度方法找到物流成本原始數據中的孤立點,刪除這些孤立點,然后對物流成本數據進行聚類,找到物流中隱藏的變化特點,采用最小二乘支持向量機建立物流成本預測模型,最后通過物流成本預測實驗對性能進行測試。測試結果表明,該模型消除了孤立點的干擾,提高了物流成本的預測精度,物流成本預測的建模效率得到改善,具有很好的實際應用價值。
關鍵詞: 物流成本; 孤立數據點; 密度方法; 預測模型
中圖分類號: TN911.1?34; TP301 文獻標識碼: A 文章編號: 1004?373X(2017)13?0114?04
Abstract: The isolated point plays the interference effect on the forecast result of the logistics cost, but its negative effect isn′t considered in current model, and the reliability of the prediction result is low. In order to improve the forecasting effect of logistics cost, the logistics cost forecasting model based on isolated point elimination is put forward. The current research status of logistics cost prediction is analyzed. The isolated points in original data of the logistics cost are found out according to the density method, and removed. The data of logistics cost is clustered to seek out the change characteristics hidden in logistics. The least square support vector machine is used to establish the logistics cost prediction model. Its performance is tested by means of the logistics cost prediction experiment. The test results show that the model can eliminate the interference of isolated point, enhance the prediction accuracy of logistics cost, improve the modeling efficiency of logistics cost forecasting, and has perfect practical application value.
Keywords: logistics cost; isolated data point; density method; prediction model
0 引 言
隨著經濟、人們生活水平以及交通技術等不斷改善,物流企業越來越多,導致企業之間的競爭加劇,物流成本預測直接影響物流企業的經濟效益,是物流研究領域中的一個重要方向,引起了人們的高度關注[1]。
物流成本與一個地區的經濟、政策以及交通狀況密切相關,是一個復雜多變系統,最原始的物流成本預測通過手工方式實現,一些專業人員采用統計學理論對物流成本進行分析和預測,該方式對小規模物流成本預測可以實現,對于現代大規模物流成本計算過程太復雜,工作效率低,而且易出錯。隨后有學者提出了物流成本自動預測模型。有學者采用時間序列法對物流成本進行建模,根據收集的物流歷史成本數據發現原物流成本將來的變化特點,相對于手工方式,提高了物流成本的預測效率,預測結果更加可靠、穩定,但它們屬于線性預測模型,而物流成本不是簡單的線性變化,同時具有隨機性、波動特性,故無法描述物流成本的非線性變化特點,導致有時預測結果與實際值相差大,物流成本的預測精度低[2]。為了克服線性預測模型的不足,有學者提出了非線性的物流成本預測模型,可以描述物流成本的非線性變化特點,提高了物流成本預測精度[3?4],主要有神經網絡、支持向量機等非物流成本預測模型,但它們缺陷也十分明顯,如支持向量機的物流成本建模時間長,神經網絡要求歷史樣本多等[5]。最小二乘支持向量機(LSSVM)減少了物流成本的建模時間,需要的物流歷史樣本少,因此成為物流成本預測的主要建模工具[6?7]。相關研究表明,在物流成本預測模型的建立過程中,一些孤立點對預測結果影響大,對LSSVM的學習過程產生干擾,因此,如何有效剔除物流成本數據中的孤立點,改善物流成本的預測效果十分關鍵[8]。
為了消除孤立點對物流成本預測結果的干擾作用,提出基于剔除孤立點的物流成本預測模型。首先采用密度方法刪除物流成本原始數據中的孤立點,然后對物流成本數據進行聚類分析,采用最小二乘支持向量機建立物流成本預測模型,物流成本預測實驗結果表明,該模型提高了物流成本的預測精度,改善了物流成本預測的建模效率。
1 剔除物流成本歷史數據中的孤立點
在物流成本的歷史數據中,由于工作人員、收集條件等限制,會有一定數量的孤立點,這些孤立點實際是一些無用的數據,會對物流成本建模過程產生干擾,因此在建立物流成本預測模型之前,準確剔除這些孤立點有助于后續的物流成本預測,因此本文采用密度方法對物流成本的歷史數據進行分析,找到其中的孤立點。
設為第個物流成本的歷史樣本數據點,為鄰域內的物流成本數目,為預先設置的最少數據量,其計算公式為:
剔除物流成本歷史數據中孤立點的步驟為:
Step1:收集一個物流成本歷史數據并設置的值。
Step2:估計樣本點的領域大小Eps。
Step3: 估計任意樣本點與其他物流成本數據點之間的距離,并估計物流成本樣本數據點的值。
Step4: 根據式(3)對物流成本歷史數據進行分析,找到其中的孤立點。
Step5:從物流成本歷史樣本中刪除孤立點,剩下的物流成本歷史數據組成學習樣本。
2 物流成本預測模型的構建
2.1 物流成本數據的聚類分析
物流成本數據具有固定變化規律,可以對剔除物流成本歷史數據進行聚類分析,選擇與預測點具有相似變化特點的數據,減少訓練數據樣本的規模,加快物流成本數據建模速度。設物流成本數據集為為物流成本樣本點數,共有類,且有則聚類分析的目標函數定義為:
2.2 最小二乘支持向量機
設物流成本建模訓練樣本為最小二乘支持向量機引入映射函數對其進行空間變換,做如下的回歸過程:
式中:和為最小二乘支持向量機的參數。
為了找到最佳二乘支持向量機參數和的值,引入松弛因子,找到與式(7)等同的多約束函數,即有:
2.3 物流成本預測模型的建立步驟
Step1:對一個具體物流成本預測問題收集相應的歷史樣本。
Step2:采用密度方法剔除物流成本原始數據中的孤立點。
Step3:對物流成本數據做如下處理,減少數據的變化幅度。
Step4:對剔除孤立點的物流成本數據進行聚類,找到預測點的最優訓練樣本數據集。
Step5:將最優訓練樣本數據集輸入最小二乘支持向量機,建立物流成本預測模型。
Step6:采用具體物流成本數據對物流成本預測模型性能進行分析,并對物流成本將來的值進行估計。
綜上可知,基于剔除孤立點的物流成本預測模型工作流程如圖1所示。
3 實驗結果與分析
為了測試基于剔除孤立點的物流成本預測模型的性能,采用VC++編寫物流成本預測程序,收集到物流成本歷史樣本,密度方法剔除其中的孤立點,最后得到200個數據,如圖2所示。
采用聚類分析選擇物流成本預測的訓練樣本,建立物流成本預測模型,物流成本的單步預測結果如圖3所示。從圖3可知,物流成本預測值與實際值之間誤差很小,這說明本文模型可以發現物流成本樣本點數據中隱藏的變化特點,是一種精度高的物流成本預測模型。
提前三步的物流成本預測結果如圖4所示。對圖4進行分析可以清楚看出,物流成本的多步預測精度要低于物流成本的單步預測精度,預測誤差增加,但還是可以從整體上描述物流成本的變化特點,預測結果有一定的實際價值,可以幫助有關部門制定相應的管理措施。
為了分析本文模型的優越性,選擇文獻[9?10]的物流成本預測模型進行對比實驗,采用預測精度(%)作為評價標準,結果如表1所示。從表1可以發現,本文模型的物流成本預測精度要高于其他模型,更好地反映了物流成本預測變化特點,降低了物流成本預測誤差,具有明顯的優越性。
在物流成本建模過程中,訓練時間影響預測效率,統計不同模型的物流成本建模時間,具體如圖5所示,對圖5的物流成本建模時間進行對比分析,可以看出,本文模型的物流成本建模時間最少,優勢十分明顯,可以滿足速度要求快的物流成本預測領域。
4 結 語
在物流成本建模過程中,預測結果的好壞與樣本選擇直接相關,為了避免孤立點對物流成本預測結果的負面影響,設計了基于剔除孤立點的物流成本預測模型,測試結果表明,無論是單步或者多步的物流成本預測結果,本文模型的性能都得到了不同程度的改善,物流成本預測誤差大幅度下降,同時由于剔除孤立點,通過聚類分析選擇與預測點相關的樣本,減少了訓練樣本的規模,物流成本建模速度加快,具有更廣的應用范圍。
參考文獻
[1] YUEN S Y, CHI K C. A genetic algorithm that adaptively mutates and never revisits [J]. IEEE transactions on evolutionary computation, 2009, 13(2): 454?458.
[2] 陳森,周峰.基于灰色系統理論的物流需求預測模型[J].統計與決策,2006(3):59?60.
[3] 王曉原,李軍.灰色GM(1,1)模型在區域物流規模預測中的應用[J].武漢理工大學學報,2011,9(3):613?615.
[4] 尹艷玲.基于自適應神經網絡的物流需求預測研究[J].河南理工大學學報(自然科學版),2010,29(5):700?704.
[5] 后銳,張畢西.基于MLP神經網絡的區域物流需求預測方法及其應用[J].系統工程理論與實踐,2005(12):43?47.
[6] 陳以,萬梅芳.BPNN神經網絡在物流系統中的應用[J].計算機仿真,2010,27(4):159?163.
[7] 胡燕祝,呂宏義.基于支持向量回歸機的物流需求預測模型研究[J].物流技術,2008,27(5):66?68.
[8] 閆莉,薛惠峰,陳青.基于灰色馬爾可夫模型的區域物流規模預測[J].西安工業大學學報,2009,29(5):495?497.
[9] 初良勇,田質廣,謝新連.組合預測模型在物流需求預測中的應用[J].大連海事大學學報,2004,30(4):43?46.
[10] 陳建軍.蟻群算法在物流配送路徑優化中的研究[J].計算機仿真,2011,28(2):268?271.
[11] 王鐵君,鄔月春.基于混沌粒子群算法的物流配送路徑優化[J].計算機工程與應用,2011,47(29):218?221.
[12] TSENG L Y, LIN Y T. A hybrid genetic local search algorithm for the permutation flowshop scheduling problem [J]. European journal of operational research, 2009, 198(1): 84?92.
[13] 孫建豐,向小東.基于灰色線性回歸組合模型的物流需求預測研究[J].工業技術經濟,2006,26(10):146?148.