李達++許仁杰++袁鵬+++李曉科++葛文++陳珍



摘要:本文緊扣行業當前的重點,以大數據分位數算法為切入點,分析行業制絲部門對應的過程物耗損耗情況,旨在建立一套標準,將物耗管控通過大數據的手段從結果導向轉換為目標引領、過程管控、結果導向三者相結合的物耗信息化管控閉環,進而系統實現“降本增效”的戰略目標。
關鍵詞:大數據;分位數預測;降本增效;物耗控制
中圖分類號:F279.23 文獻標識碼:A 文章編號:1007-9416(2017)03-0149-04
1 大數據分位數算法對于煙草行業降本增效的有效性分析
當前,從行業看,受宏觀經濟曲折復蘇和煙草消費環境日益趨緊的影響,行業層面增長速度回落、工商庫存增加、結構空間變窄、需求拐點逼近“四大難題”進一步凸顯[1],[2],[3];卷煙銷量下滑、生產成本上升、商業利潤透支“三個嚴峻形勢”進一步加劇。[4]從云南中煙看,傳統發展動能有所減弱,新的發展動能不強,品牌競爭力不突出,市場拓展更加艱難。從集團看,面臨著優質制造、快速響應、內部挖潛、爭先進位的巨大壓力和挑戰。
本文通過將大數據分位數算法在煙草行業制絲運用的計算公式、技術實現思路、技術實施路徑、算法實現過程、實施成果等內容進行系統的闡述,證明了大數據分位數算法對于煙草行業降本增效的有效性。
2 大數據分位數算法實現過程
2.1 大數據分位數算法95%置信區間計算公式
其中,Pm——第m百分位數;L——Pm所在組的組實下限;U——Pm所在組的組實上限;f——Pm所在組的次數;Fb——小于L的累積次數;Fa——大于U的累積次數。
根據分位數計算公式,可得95%置信區間的取值范圍,如圖1所示,95%置信區間表示如下內容:(1)每批次物耗不在置信區間范圍內的可能性僅為5%,為小概率事件,當出現時則表示物耗異常。(2)大數據分位數置信區間預測無需樣本數據滿足正態性,這與傳統數理統計對于樣本符合正態性的依賴相比,具有較高的實用性。特別是煙草行業工業現場數據均為非正態數據,大數據分位數置信區間預測有效解決了傳統數理統計對于工業現場數據存在回歸擬合度差的問題,能夠有效挖掘工業現場數據帶來的價值。[7]
2.2 大數據分位數算法技術實現思路
以大數據分位數算法為切入點,運用至煙草過程工序物耗分析,可得如圖2的概率密度圖。
在生產過程中,對收集的每一批次成本控制實時數據進行統計、即時化分析,計算出絲率(Z)。若Z1≤Z≤Z2,則表明成本控制處于正常范圍,無需特殊控制;若Z≤Z1,則表明成本控制出現異常,需要進行人工干預;若Z≥Z2,則表明成本控制效果較好,應檢查數據采集、記錄、統計等環節無誤后,分析導致成本下降的原因,總結經驗應用于后續生產中。
2.3 大數據分位數算法技術路徑(圖3)
技術實施路徑描述如下:首先,計算各生產點投入物料重量和產出物料重量,判斷工序投入和產出的物料是否處于同一含水率標準情況下;若含水率一致,則進行工序投入產出比計算。若含水率不一致,則針對投入物料對應的含水率和產出物料對應的含水率分別進行統一標準的物料衡算(12%),衡算結束后再得出對應的工序投入產出比;其次,分品牌、分工序、分時段定出對應的大數據分位數預測區間;最后,將大數據分位數預測結果運用于日常物耗分析控制中,加載機器自學習機制,如果沒有超過機器自學習周期,則該標準一直有用,如果超過了機器自學習周期,就要重新進行投入產出比計算,得出新的分位數預測區間,再用于日常物耗分析控制中。
2.3 基于R語言實現的大數據物耗管控分位數預測算法實現過程
(1)繪制流量指標折線圖、求水分值均值、求累計量最大值R程序(圖4)。
(2)水分折算及結果導出R程序(圖5)。
(3)運用大數據分位數預測診斷算法,得出投入產出矩陣后,繪制圖形R程序(圖6)。
3 大數據分位數預測對于煙草行業制絲部門的實施實例
3.1 測試對象
以云南中煙紅云紅河集團曲靖卷煙廠為測試對策,以云煙(紫)2016年8月30日至9月18日生產云煙(紫)模組1的全部數據作為測試對象,共計133個批次。
3.2 測試方法
以大數據分析的方法基礎,運用分位數預測的方法,得出各生產段對應的投入產出比合理范圍,將該范圍納入過程分析管控,實現物耗分析的過程化管控標準,幫助生產廠提升物耗控制水平。
3.2.1 物耗計算需采集的數采點(表1)
3.2.2 物耗衡算公式
備注:物料衡算均已各段以12%的水分作為標準進行衡算。
3.2.3 各段投入產出比計算公式
備注(物料衡算):一級加料前物料累積量以一級加料入口水分進行折算,松散回潮物料累積量以松散回潮入口水分進行折算。
備注(物料衡算):二級加料前物料累積量(物料、糖料)以二級加料入口水分進行折算,一級加料物料累積量以一級加料入口水分進行折算。
備注(物料衡算):切絲前物料累積量(物料、糖料)以切絲入口水分進行折算,二級加料物料累積量以二級加料入口水分進行折算。
備注(物料衡算):烘絲前物料累積量以烘絲入口水分進行折算,切絲物料累積量以切絲入口水分進行折算。
備注(物料衡算):薄板絲物料累積量以烘絲冷卻水分進行折算,烘絲前物料累計量以烘絲入口水分進行折算。
備注(物料衡算):加香前物料累積量、摻配物料累積量(氣流絲、薄板絲、梗絲、回絲)均以烘絲冷卻水分進行折算。
備注(物料衡算):裝箱量累積量(物料、香料)以加香后水分進行折算,加香前物料累積量以烘絲冷卻水分進行折算。
3.3 大數據分位數置信區間預測成果
3.3.1 松散回潮投入產出比(圖7)
經大數據分位數預測,松散回潮投入產出比95%預測區間為【98.29%,99.46%】。
3.3.2 一級加料投入產出比(圖8)
經大數據分位數預測,一級加料投入產出比95%預測區間為【98.98%,99.92%】。
3.3.3 二級加料投入產出比(圖9)
經大數據分位數預測,二級加料投入產出比95%預測區間為【96.88%,99.71%】。
3.3.4 切絲投入產出比(圖10)
經大數據分位數預測,切絲投入產出比95%預測區間為【96.88%,99.71%】。
3.3.5 烘絲投入產出比(圖11)
經大數據分位數預測,烘絲投入產出比95%預測區間為【99.22%,99.92%】。
3.3.6 摻配投入產出比(圖12)
經大數據分位數預測,摻配投入產出比95%預測區間為【98.51%,99.18%】。
3.3.7 加香投入產出比(圖13)
經大數據分位數預測,加香投入產出比95%預測區間為【96.29%,99.81%】。
4 大數據分位數預測算法在煙草行業降本增效的前景分析
通過以曲靖卷煙廠作為試點,全面展示了大數據分位數算法在煙草行業制絲車間如何實現降本增效的全過程,即建立各工序投入產出比的預測置信區間,將該區間作為衡量過程物耗控制水平是否異常的標準,進而快速、高效地挖掘出過程物耗異常的改善點,進而快速實施改善,確保物耗控制水平維持在一個較高的層面,為全面實現降本增效打下堅實基礎[5],[6]。
需要指出的是,通過大數據分位數預測算法建立的投入產出比置信區間是一個動態更新的過程,即需要加載機器自學習算法,在學習周期內,無需進行自學習運算[7]。當超過自學習周期,就需要重新運算,得出新的工序投入產出比置信區間[8],進而不斷符合生產的實際情況,持續發揮出數據挖掘帶來的價值,為行業全面實現降本增效提供了一套有效的發展之路。
參考文獻
[1]朱蕓.新形勢對煙草行業的影響及應對策略研究[J].改革與開放,2015(07).
[2]張謙,胡劍波.新形勢下云南煙草經濟發展的SWOT分析與對策[J].安徽農業科學,2011(06).
[3]俞震東.中國煙草業的困境及改革路徑研究[D].浙江工業大學,2014.
[4]陳建輝.順勢而為,主動作為——卷煙提稅順價對煙草商業經營影響分析及思考[M].2015.
[5]孟艷超.夯實煙草行業降本增效工作之思路[J].企業研究,2016(04).
[6]嚴厚平.淺析煙草企業如何實現降本增效[J]. 財經界(學術版),2016(10).
[7]何清,李寧,羅文娟,史忠植.大數據下的機器學習算法綜述[J].模式識別與人工智能,2014(04).
[8]郭亞寧,馮莎莎. 機器學習理論研究[J].中國科技信息,2010(04).