董翔英, 呂亞飛, 鄒饒邦彥
(1. 軍事交通學院軍用車輛系, 天津 300161; 2. 軍事交通學院研究生管理大隊, 天津 300161)
基于數據挖掘的車輛器材倉庫庫存結構分析
董翔英1, 呂亞飛2, 鄒饒邦彥2
(1. 軍事交通學院軍用車輛系, 天津 300161; 2. 軍事交通學院研究生管理大隊, 天津 300161)
針對后方車輛器材倉庫庫存車型結構、庫存器材品種結構和數量結構不合理問題,以車輛器材實際消耗的歷史數據為挖掘對象,應用K-均值聚類算法和BP神經網絡,建立了基于數據挖掘的定品種、定數量的庫存結構分析模型,并利用R語言對所建模型進行了驗證,為確定車輛器材的庫存品種結構和數量結構提供了理論支撐。
車輛器材倉庫; 庫存結構; 數據挖掘; R語言
后方車輛器材倉庫(簡稱“倉庫”)是實施車輛器材供應保障的基地,對提高車輛裝備的保障能力具有重要作用,其基本任務是組織車輛器材的接收、保管和發放等業務以及管理活動。庫存結構是指在一定庫存中,各器材的品種和數量構成的相互比例關系,主要包括各器材品種、數量所占比例以及單品種數量所占比例。庫存結構主要采用庫存車型、各車型器材品種和數量3類參數來描述。因此在編制車輛器材周轉量計劃時,要進行“三定”,即定品種、定數量、定總值,以確保庫存結構的合理性,使庫存器材結構和車輛維修所需器材的實際消耗相匹配,既滿足器材消耗需求,又避免積壓浪費,使有限的周轉器材發揮最大的軍事和保障效益。目前,各倉庫的庫存結構基本能滿足各保障單位對車輛維修器材的需求,能完成車輛維修保障任務,但由于人員崗位輪換性大、器材消耗規律難以掌握等問題,現有的器材庫存結構與車輛維修保障的實際需求仍有一定偏差,難以達到現代化后勤的“精確化保障”要求。
國內對庫存器材的分類主要采用ABC分類法,如羅雪等[1]利用層次分析法建立了一套包含器材籌備難易程度、關鍵程度及經濟性的評價指標對器材進行ABC分類;郭智敏等[2]基于器材的損耗規律、籌措敏捷度及關鍵程度將器材歸為ABCD四類。ABC分類法具有一定的指導性和實用性,但由于其應用過程中評價指標的建立和關鍵程度的區分需要采用專家打分法,主觀性較強,分類結果存在不確定性。數據挖掘是從數據庫中自動發現有用信息和相關模式的過程,即從大量的、有噪聲的、不完全的、隨機的和模糊的數據中,發現并提取隱含其中的、事先所不知道的、潛在有用信息及知識的過程,數據挖掘的常用算法有預測、聚類和關聯等[3]。
目前,主要依經驗判斷進行器材倉庫庫存結構調整,主觀因素影響大,K-均值聚類和BP神經網絡算法通過對歷史數據的挖掘分析,可得到更為客觀的分類和預測結果[4],為此,筆者運用K-均值聚類算法和BP神經網絡建立器材品種分析模型和器材數量預測模型,為確定車輛器材的品種結構、數量結構提供理論依據。
聚類分析是根據數據中所發現的對象及其關系的相關信息,將數據對象分組,使組內對象之間相關,不同組的對象之間不相關。組內對象的相關性越大,組間對象的差別越大,則聚類結果越符合實際。
K-均值聚類是一種基于原型的簇劃分的聚類方法,即以歐幾里得距離為劃分指標,以數據集的平均值為原型,將數據對象劃分為指定的k個簇[5]。目標函數為所有簇的數據對象與質心之間的誤差平方和小于設定的閾值,即

(1)
其中:o為數據對象;mi為第i個簇Ci的質心。
1.1 器材品種分類模型構建
與地方物流倉庫相比,后方車輛器材倉庫的出入庫不受“市場需求”的影響,出入庫完全按照制定的出庫計劃、入庫計劃和調撥計劃進行,計劃性較強[6],因此筆者不考慮器材的備貨期、到貨情況和同類器材的替換情況等,以出庫量、出庫頻率和價格為參數對各種器材進行聚類分析,具體步驟如下:
1)數據獲取。將車輛器材管理信息系統中的出庫記錄導出,并進行數據預處理,形成數據出庫表,每條記錄包括器材編碼(qc)、出庫憑證號(id)、單次收發數和單價。
2)數據分組。應用R語言的ddply函數對數據進行分組整合,計算每種器材的總出庫量(count)、出庫頻率(fre)和單價(price),形成聚類初始表。
3)數據挖掘。應用R語言的kmeans函數進行挖掘分析。
4)結果分析。利用R語言的可視化函數生成聚類結果分布圖,分析各類器材的特點。
1.2 實例驗證和結果分析
1.2.1 實例驗證
以某車輛器材倉庫2014年度的出庫歷史記錄(共2383條)為實驗數據,借助R語言進行挖掘分析和驗證。按車型該數據分為CA1122、EQ2050、EQ2102和EQ2050共4類,表1為EQ2050出庫記錄表。

表1 EQ2050出庫記錄
應用ddply函數
count1<-ddply(iq,.(qc), function(x) sum(x$count)) #各種器材總出庫量
count2<-ddply(iq,.(qc), summarize, number=length(qc)#各種器材頻率
對表1的數據進行分組,得到如表2所示的聚類初始表。

表2 聚類初始表
利用kmeans函數對表2中的數據進行聚類分析,聚類數定為4類,相應的程序代碼如下。
library(xlsx) #載入包
workbook<-"C:/zhong.xlsx" #導入數據
mydata<-read.xlsx(workbook,1)
cludata<-mydata[,2 ∶4] #提取聚類變量
set.seed(12345)
clur<-kmeans(x=cludata,centers=4,nstart=4)
應用Clur$size、Clur$centers和Clur$cluster函數查看聚類結果,如圖1所示。
利用R語言的可視化函數plot和scatterplotMatrix

圖1 聚類結果
分別生成聚類結果分布圖和單價出庫頻率、總出庫量3個聚類要素的矩陣散點圖,如圖2、3所示。

圖2 聚類結果分布圖

圖3 單價、出庫頻率和總出庫量的矩陣散點圖
1.2.2 結果分析
由圖3可見:通過聚類分析將所有器材分為4類,其中:第1、3、4類器材的數量(Clur$size)都較少,分別只有16、6、19種,大部分器材為第2類器材,共178種;且第1類器材為價格(Clur$centers price)最便宜的小件器材,出庫頻率(Clur$centers fre)和總出庫量(Clur$centers count)均最大,該類器材應確定為最重要類器材,應保持較大的庫存量;第2類器材為價格一般的中小件器材,出庫頻率和總出庫量均位居第2,應確定為次重要類器材,應保持一定的庫存量;第3類器材為價格高昂的大件總成,其總出庫量和出庫頻率均最小,一年只有幾次,應確定為不重要類器材;第4類器材為價格較高的大中件器材,總出庫量和出庫頻率與第2類器材相當,應確定為次重要類器材。這樣,便將所有器材分為重要類、次重要類和不重要類3類,具體如表3所示。

表3 聚類結果表
表4為該倉庫的庫存器材結構與其2014年度的出庫器材結構對比情況。

表4 某倉庫庫存器材結構與2014年度出庫器材結構對比
由表4可以看出:庫存器材結構與出庫器材結構不符,不重要類器材庫存積壓過多,次重要類器材庫存量不足,重要類器材庫存量偏多,因此,在制訂下一季度的器材入庫量時,應結合分析結果進行調整,大幅減少不重要類器材的入庫量,增加次重要類器材的入庫量,適當減少重要類器材的入庫量。
2.1 器材數量預測模型構建
由于神經網絡具有出色的自學能力,其能以任意精度逼近非線性關系,可用來預測器材的出庫量,因此筆者采用BP神經網絡對編號為142784200的器材出庫量進行預測。
表5為2014年度該倉庫142784200器材的出庫記錄。

表5 2014年度器材142784200的出庫記錄
由于器材的出庫記錄為一維數據,而BP神經網絡的輸入為多維數據,因此筆者以器材前4次的出庫量(m-4、m-3、m-2、m-1)為輸入,預測后1次(第m次)出庫量。為了使輸入數據的數量級與傳遞函數的輸出范圍相符,需將輸入數據進行標準化處理,使其在[0,1]區間內[7]。因此,根據

(2)
對表5的數據進行處理,得到如表6所示的預處理樣本數據。式中:n為所有數據中最大值的整數位,這里取n=2。
這樣,神經網絡的結構可確定為3層,其中:輸入層節點數為4,即器材前4次出庫量;隱含層節點數一般為輸入層節點數×2+1,這里取9;輸出層節點數為1,即出庫量預測值[8]。

表6 預處理樣本數據
2.2 實例驗證與結果分析
應用R語言的neuralnet函數
bpnet1<-neuralnet(m~m4+m3+m2+m1,data=mydata,hidden=9, err.fct=“sse”,linear.output=FALSE,threshold=0.00001)
對所建模型進行驗證。
以表5中的前24組數據為學習樣本,最后2組數據為測試樣本,神經網絡運行過程和結果分別如圖4、5所示。

圖4 神經網絡運行過程

圖5 神經網絡運行結果
在神經網絡學習訓練過程中共進行了10 764次迭代,損失值為0.000 033;第1節點m-4到隱含層第1節點的偏差為1.080 14,權重為-0.956 93;隱含層第1節點到輸出層的偏差為0.969 3,權重為-1.906 41。
應用表5中的最后2組數據對所建BP網絡模型進行測試,輸入數據分別為M1=(0.05, 0.05,0.02,0.1)和M2=(0.05,0.02,0.1,0.1),預測結果如圖6所示,利用compute函數可得結果分別為0.087和0.053,其平均誤差為e=1/2(0.087/0.1+0.053/0.06)=87.7%,因此,可認為該神經網絡具有較好的擬合性。

圖6 神經網絡預測結果
利用測試后的神經網絡對各器材的出庫量進行預測,得到各器材的出庫量預測結果,如表7所示。器材助理員根據表7所示的預測結果可預測下一季度各器材的需求量,并據此上報倉庫下一季度總的器材需求量。

表7 器材出庫量預測結果
[1] 羅雪, 崔南方. 維修備件基于AHP的ABC分類模型[J]. 工業工程與管理, 2004, 11(6):17-19.
[2] 郭智敏, 嚴洪森, 陳施華,等. 備件庫存控制方法研究[J]. 計算機集成制造系統, 2003,9(11):128-132.
[3] OliviaParrRud. 數據挖掘實踐[M]. 朱揚勇,譯. 北京:機械工業出版社, 2003:65-72.
[4] 肖娟. 數據挖掘在物流業的應用綜述[J]. 統計與決策, 2013 (11): 95-97.
[5] 薛薇. 基于R的統計分析與數據挖掘[M]. 北京:中國人民大學出版社, 2015: 273-379.
[6] 趙復濤. 軍用車輛器材周轉量優化研究[D]. 天津: 軍事交通學院, 2012.
[7] 劉晶璟. 基于BP神經網絡的零售連鎖企業安全庫存預測方法[J]. 物流技術, 2012, 31(11): 326-328.
[8] 曹艷華, 陳春良, 龔正波, 等. 基于神經網絡趨勢預測的裝甲車輛柴油機壽命預測[J]. 裝甲兵工程學院學報, 2014, 28(5): 29-33.
(責任編輯:王生鳳)
Inventory Structure Analysis of Vehicle Material Warehouse Based on Data Mining
DONG Xiang-ying1, Lü Ya-fei2, ZOU Rao-bangyan2
(1. Department of Military Vehicles, Academy of Military Transportation, Tianjin 300161, China; 2. Brigade of Postgraduate Management, Academy of Military Transportation, Tianjin 300161, China)
Aiming at the problems of the unreasonable structure of inventory vehicle types, inventory varieties and inventory quantities in the vehicle material warehouse, this paper, making full use of the data of actual consumption of vehicle material, establishes the analysis model on determining the variety and determining the quantity based on K-means cluster analysis and BP neural network. The model is verified in R and the result provides theoretic support for the decision of variety and quantity structure of the vehicle material warehouse.
vehicle material warehouse; inventory structure; data mining; R language
1672-1497(2016)05-0031-05
2016-07-07
董翔英(1963-),女,教授,碩士。
E92
A
10.3969/j.issn.1672-1497.2016.05.006