余俊旸 張芬 潘回歸 郭清海



摘 要:針對湖北煙草商業企業在物流對標管理中因地域差異導致的評價不公平問題,本文根據國家煙草專賣局物流對標管理分類要素體系,分別利用K均值聚類、凝聚聚類以及Birch聚類方法對湖北省17個市州進行了聚類分析。通過比較輪廓系數得分將17個市州分為四類,且三種聚類方法所得結果一致。在此基礎上,進一步對湖北省17個市級煙草公司進行對標分析,驗證了本文分類結果的合理性。本文為湖北省煙草商業物流分類對標管理工作提供了有意義的借鑒。
關鍵詞:煙草物流;分類對標管理;K均值聚類;凝聚聚類;Birch聚類
中圖分類號:F23 文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2021.14.053
0 引言
對標管理作為重要的科學管理方法在眾多領域得到了廣泛的應用。自2009年開始,煙草行業全面開展對標工作。在此期間,行業物流在對標管理方面也進行了許多積極探索,有力推動了行業物流管理水平的提升。然而,隨著行業高質量發展要求的提出,原有物流對標體系已不能完全適應新的管理模式和運行機制的需要。存在的主要問題:一是對標管理體系不完善,二是對標指標體系不健全。其中,對標管理體系的問題主要集中在標桿的選擇上。通常情況下,標桿是行業內績效最優的某個企業。煙草行業物流對標管理,選擇的標桿就是在某一指標上績效表現最優的企業,其他企業從經營管理、產品質量、成本控制等各方面找出與標桿企業的差距并向其學習,進而彌補自身短板以提升核心競爭力。然而,只依據績效排名確定標桿的方式,往往不具備可比性和適用性。比如省會城市,由于其先天的地理環境、人口規模、經濟發展等優勢,以及自身的企業規模、人力資源、技術條件等差異,其各項指標都會明顯優于省內其他地市。如果統一都以省會城市為標桿的話,對一些地市特別是經濟欠發達地市就很不公平,對標管理也難以起到作用。基于此原因,2019年底,國家煙草行業專賣局印發了《煙草商業企業物流分層分類對標管理規范(試行)》,對省級商業企業和重點城市商業企業試行分層分類對標管理,打響了行業層分類對標的“發令槍”。同時,鼓勵各省級商業企業以《規范》為依據,構建適宜于本地的分類模型來開展地市級商業企業物流類對標管理。
分類對標首先需要解決分類問題。對目標企業進行分類的方法有很多,其中通過專家打分以及計算指標權重并加權排序等方法難免會受到一些主觀影響,相對來說,利用聚類方法進行分類更加客觀,因此聚類分析方法也得到了越來越廣泛的應用。高珊選取降水量等指標來表現黃淮海地區的干旱程度,并利用K均值聚類法對其進行分區;肖自乾根據在線教學時學生的表現,通過K均值聚類將他們分為不同的群體,進而方便因材施教;笪可寧通過凝聚聚類法將全國35個大中城市劃分為3類,再建立面板數據回歸模型對影響商品住宅價格的因素進行分析;施立珊利用凝聚聚類方法對教師的教學質量進行分析;宋志飛同時采用K均值聚類、凝聚聚類、DBSCAN聚類三種方法對海南農墾耕地類型進行分析,然后通過各自的特征頻數統計表來從中選中相對更優的聚類方法。王夢瑤將K均值聚類和Birch聚類結合起來對用戶評論數據進行聚類。
在前人的研究基礎之上,本文對湖北省17個市州的煙草物流數據進行實證研究,選取了K均值聚類、凝聚聚類、Birch聚類這三種聚類方法來分別構建分類模型,然后通過輪廓系數來比較評價聚類效果并確定最優聚類個數,最后對湖北省17個市級煙草公司進行對標分析。
1 聚類模型與評估指標
1.1 K均值聚類(K-means)
K均值聚類屬于原型聚類,是應用最廣泛的一種聚類方法。它首先需要自行設定聚類個數K,再從樣本中隨機選取K個點作為初始聚類中心,然后計算其他點與這K個中心點的距離,將每個點分配給距離最近的聚類中心,全部分好后就形成了K個簇;之后計算各個簇中的樣本均值,將其作為新的聚類中心,再重復迭代計算,直到目標函數最小化,通常是使樣本和所屬的聚類中心之間的距離總和達到最小。
1.2 凝聚聚類(Agglomerative Clustering)
凝聚聚類屬于層次聚類的一種,同樣需要先指定聚類個數K,再將每個樣本點都作為聚類中心,然后再將距離最近的兩個類進行合并,不斷重復這個過程,直到只剩下K個類。根據使用的距離計算公式不同,還可以再細分成不同的凝聚聚類算法。
1.3 Birch聚類
Birch算法的全稱是利用層次方法的平衡迭代規約和聚類(Balanced Iterative Reducing and Clustering Using Hierarchies)。該算法利用可用資源生成最好的聚類結果,采用多階段聚類技術,把待分類的數據插入一棵樹中,并且原始的數據都在葉子節點上。要注意的是,Birch算法對每一個數據點的聚類決策都基于當前處理過的數據點,而不是基于全局的數據點,具體算法原理可參考文獻。
1.4 輪廓系數
輪廓系數是評估聚類效果的常用指標,適用于原始數據實際類別未知的情況。假設使用某種聚類方法將樣本分為了K類,然后計算每個樣本的輪廓系數,用a(i)代表第i個樣本與其所屬類中其他樣本的平均距離,用b(i)代表第i個樣本與距離最近的一個類中樣本的平均距離,則第i個樣本的輪廓系數計算公式為:
S(i)=b(i)-a(i)max(a(i),b(i))/*MERGEFORMAT(1)
在求得了所有樣本的輪廓系數后,將它們取平均就得到了最終總的輪廓系數,其取值范圍為[-1,1],越靠近1則說明聚類效果越好,反之越靠近-1則效果越差。
2 物流分類指標評價體系
為了保證所建分類模型的客觀性和可比性,排除受主觀因素影響較大的指標,并從客觀因素中篩選出對企業物流管理影響較大的指標,并將之分為外部要素和內部要素。其中,外部要素是基本不受企業控制而只與所處地域相關的因素,包括區域經濟水平、城鄉結構、自然環境;內部要素則是影響物流需求與配送的主要因素,包括卷煙配送規模和卷煙零售客戶。本文最終采用10項指標來構建煙草商業企業物流分類指標評價體系,具體見表1。
3 湖北省煙草商業企業物流分類及實證
綜合各市州統計年鑒數據、企業內部數據和官方網站數據,本文根據2020年湖北省煙草系統17家市洲商業公司的各指標數據,分別采用K均值聚類、凝聚聚類、Birch聚類三種模型對湖北省17個市州進行聚類,并利用平均輪廓系數得分來分別評估每個模型的最優分類數。
首先對數據進行預處理,利用Python軟件從Sklearn庫中調用MinMaxScaler()函數,將各維度的數據標準化到0到1之間,以消除指標間單位和尺度差異的影響。
在標準化數據的基礎上,先利用分層聚類方法得到聚類樹狀圖(圖1)作為分類結果的初步參考。從圖1中可以看到,大體上可以把湖北省17個市州分為四類。
為了進一步驗證分成四類的合理性,分別利用K-means模型、凝聚模型、Birch模型,選取聚類類數n從3到7,計算每種模型的輪廓系數,結果如圖2-圖4所示。
由圖2-圖4可以看出,無論是哪種模型都是當n=4時輪廓系數最大,即三種模型的最優分類方式都是將17個市州分成四類,且最終分類結果相同:武漢為一類,黃石、襄陽、荊門、孝感、黃岡、咸寧為一類,十堰、宜昌、神農架林區、恩施、隨州為一類,鄂州、荊州、仙桃、潛江、天門為一類。
基于以上分類結果,對每一類計算該類10項指標的平均值,再對每項指標進行標準化,得到最終的標準分如表2所示。
由表2可見,第一類武漢,除了地形地貌指標外,在卷煙配送規模、卷煙零售客戶、區域經濟水平、區域城鄉結構等方面的各項指標的標準分均在1.60到1.72之間,而其它三類相應的標準分均為負值,由此可看出武漢與其他三類的差距很大,因此被單獨分為一類。
第二類包括黃石、襄陽、荊門、孝感、咸寧、黃岡。該類的配送總量指標的標準分遠遠低于武漢,但明顯高于第三類和第四類。另外,該類的丘陵指標的標準分為1.70,為四類中的最高,而其它三類的標準分均為負值。
第三類包括十堰、宜昌、林區、恩施、隨州。該類有一個明顯特征是地形地貌中山地和高山地指標的標準分最高,分別為1.63和1.73。因此,在物流考核時要著重注意這種多山地的特殊情況。受這種情況影響,這一類的單元配送量、道路客戶密度、區域客戶密度、經濟密度和常住人口城鎮化率指標的標準分均為四類中的最低。
第四類包括鄂州、荊州、仙桃、潛江、天門。該類的配送總量指標標準分是最低的;但平均平原地形占比是最高的,其標準分達到1.08;其余指標相對來說都處于居中水平。
4 分類對標應用
以2020年1月至9月湖北省17個市級煙草公司的單箱物流成本(元/箱)、人均配送效率(箱/人)、單車日均送貨數量(條)指標為例,將聚類結果應用于對標分析。
4.1 單箱物流成本分類對標
圖6所示,從分類情況看,武漢市作為省會城市和區域物流中心,其物流設備設施智能化程度是其他市州無法比擬的。武漢市公司宜以自身為標桿,進行縱向對比。武漢市公司單箱物流成本為144.44元/箱,同比下降24.92%,降幅明顯。第二類標桿值為148.61元/箱(咸寧),同比降幅最大-27.30%(咸寧);第三類標桿值為123.43元/箱(林區),同比降幅最大-24.87%(恩施);第四類標桿值為153.85元/箱(荊州),同比降幅最大-10.69%(荊州)。綜合分析,除武漢外,第三類單箱物流成本平均值最低(151.19元/箱),第二類同比降幅最大(-5.82%)。第二類6個地市公司單箱物流成本平均值高于第三類和第四類,原因在于其配送總量明顯高于其他兩類。類中襄陽單箱物流成本最高,咸寧單箱物流成本最低,與分類指標中兩地的地勢地貌相關。
4.2 人均配送效率分類對標
圖7所示,武漢市公司人均配送效率遙遙領先于其他公司,為1474.59箱/人,同比增長21%,增幅明顯。第二類標桿值為1136.51箱/人(黃石),同比增幅最大5.24%(黃石);第三類標桿值為918.94箱/人(宜昌),同比增幅最大3%(隨州);第四類標桿值為1342.61箱/人(鄂州),同比增幅最大5.49%(荊州)。綜合分析,除武漢外,第二類人均配送效率均值最高(933.8箱/人),第四類同比增幅最大(1.58%)。第三類人均配送效率明顯低于其他類,類別之間差異明顯。
4.3 單車日均送貨數量分類對標
圖8所示,武漢市公司單車日均送貨數量為5662.09箱,同比增長40.33%。第二類標桿值為6530.08箱(黃岡),同比增幅最大66.96%(黃岡);第三類標桿值為5271.68箱(十堰),同比增幅最大40.63%(仙桃);第四類標桿值為5490.81箱(仙桃),同比增幅最大74.44%(仙桃)。綜合分析,第四類單車日均送貨量均值最高(4787.89箱),第二類同比增幅最大(27.06%)。第三類單車日均送貨量明顯低于其他類,類別之間差異較為明顯。
5 結論
(1)本文利用K均值聚類、凝聚聚類、Birch聚類三種模型對湖北省17個地市煙草企業數據進行聚類分析比較發現,17個地市煙草企業最終分為4類最為合適,其中:武漢市公司為第一類;黃石、襄陽、荊門、孝感、咸寧、黃岡為第二類;十堰、宜昌、林區、恩施、隨州為第三類;鄂州、荊州、仙桃、潛江、天門為第四類。
(2)將上述分類結果應用于湖北省煙草商業企業物流對標分析,各類別之間區別很明顯,準確體現了各城市在所選指標數據上的差異性,為進一步提升湖北省煙草商業企業物流對標工作科學性、可比性和適用性提供了重要依據,有助于提高對商業企業物流整體運行情況的分析和預測質量,推動行業物流高質量發展。
參考文獻
[1]黃帆.關于煙草商業物流分層分類對標管理體系的思考[N].東方煙草報,2020-01-18(003).
[2]陳昌華,黃河,尹健康,等.煙草商業企業物流對標管理分類體系研究——以四川省為例[J].中國煙草學報,2020,26(03):114-120.
[3]高珊,陳杰,許朗,等.黃淮海地區干旱分區研究[J].節水灌溉,2020,(10):101-106.
[4]肖自乾,陳經優.基于數據挖掘聚類算法的網絡學習平臺學生成績分析[J].電腦知識與技術,2020,16(19):28-29.
[5]笪可寧,楊賀貞.價格聚類視角下商品住宅價格影響因素實證研究[J].沈陽建筑大學學報(社會科學版),2020,22(05):494-499.
[6]施立珊,李就娣,莫卓達,等.聚類分析在高校教務系統中的應用研究[J].電腦知識與技術,2016,12(13):18-20.
[7]宋志飛,彭金蓮.海南農墾耕地類型的聚類分析[J].計算機應用研究,2020,37(S1):88-91.
[8]王夢遙,王曉曄,洪睿琪,等.基于改進BIRCH聚類算法的評價對象挖掘[J].軟件,2019,40(11):9-12+61.
[9]尚家澤,安葳鵬,郭耀丹,等.基于閾值的BIRCH算法改進與分析[J].重慶郵電大學學報(自然科學版),2020,32(03):487-494.