【摘 要】 近年來,我國鐵路貨運企業的運營風險及其復雜程度不斷上升,如何對其運營風險進行有效預防和管控是企業發展過程中亟待解決的問題。文章以A鐵路貨運公司為例,從公司主要運營環節業務流程出發,分析其運營過程中的關鍵風險點,以此為依托從調度、市場、合同、采購、應收賬款、資金運營、運力、人力、研發及內控十大維度構建運營風險預警指標體系,同時基于公司近五年各維度運營數據,運用K-Means聚類與隨機森林組合模型構建公司運營風險預警機制,通過參數調優和訓練學習得到最優模型,并采用混淆矩陣及其二級指標評價該模型的有效性和泛化能力。結果表明預警準確率達到95.14%,AUC值為96.30%,預警效果良好。研究為鐵路貨運企業運營風險管控提出了合理化建議。
【關鍵詞】 機器學習; 鐵路貨運; 運營風險預警
【中圖分類號】 F234;F230" 【文獻標識碼】 A" 【文章編號】 1004-5937(2025)07-0061-08
一、引言
近年來,隨著我國供給側結構性改革的不斷推進,鐵路貨運快速發展,并逐步實現由鐵路貨運向現代化物流的轉變。國務院辦公廳頒布的《“十四五”現代物流發展規劃》強調,發展壯大戰略性新興產業要求現代物流適應多元化專業化服務的需求,提升價值創造能力,推進產業基礎高級化、產業鏈現代化。現代信息技術廣泛應用既為物流創新發展注入新活力,也要求加快現代物流數字化、網絡化、智慧化賦能,打造科技含量高、創新能力強的智慧物流新模式。黨的二十屆三中全會指出,要深化綜合交通運輸體系改革。在我國各種貨運方式快速發展的背景下,貨運市場競爭日益激烈,客觀上要求鐵路貨運企業把握物流需求多元化趨勢,加強現代物流科技賦能和創新驅動,推進現代物流服務領域拓展和業態模式創新,提高企業的運營效率,對市場變化做出快速、準確的判斷和反應。
因此,在大數據時代如何運用機器學習技術構建具有前瞻性、智能化和精細化的鐵路貨運企業運營風險預警機制,提高交通運輸設備制造企業的運營風險預警能力,同時有針對性地對企業運營過程中存在的問題進行整改,實現運營風險關口前移,從而有效降低企業運營風險,提高企業經濟效益成為重要課題。
二、運營風險預警相關理論基礎
鐵路貨運企業運營風險預警是指以企業內部管理信息和外部市場競爭信息為基礎,構建合適的指標體系,運用各種定量或定性研究方法深入挖掘企業運營特征和運營風險之間的規律及其對應關系,從而實現企業運營風險狀態的實時判定,并將影響企業運營風險的關鍵性因素提取出來,為企業管理者進行運營風險管控提供建議,避免潛在風險造成巨大損失。
(一)鐵路貨運運營風險相關研究
通過對國內外鐵路貨運運營風險相關文獻進行梳理,發現國外起步相對較早,不同地區的研究方向差異明顯,歐洲地區傾向于對企業風險與成本之間的平衡進行研究,美國則主要研究企業在運營過程中的安全風險。
歐洲鐵路貨運運營風險管理的原則是有效平衡風險水平和成本,即在降低風險的同時盡量使降低風險所付出的代價和成本最小,從而有效提高鐵路貨運企業的經濟效益[ 1 ]。Silla和Kallberg[ 2 ]通過對芬蘭鐵路1959—2008年的安全水平進行數據統計、分析和評價,建立了事故模型。美國鐵路貨運運營風險管理的概念可以追溯到20世紀30年代。Muttram[ 3 ]系統性地對鐵路貨運行車過程中的安全問題進行評價和實例分析;Jafarian和Rezvani[ 4 ]利用模糊環境下的故障樹分析法,對鐵路貨運運營風險進行了綜合評價。
國內鐵路貨運領域的運營風險研究起步較晚,近年來針對鐵路貨運企業運營風險的研究逐漸豐富起來。隨著鐵路貨運的不斷創新發展,鐵路貨運企業也在逐步將運營風險管理應用到實際工作中,以實現企業降本增效。呂峰[ 5 ]針對鐵路貨運過程中存在的安全風險進行深入研究,提出了完善管理措施及通過建立激勵機制來提高安全風險管理效果等相關建議;許妙榅[ 6 ]通過對鐵路貨車維修過程中的安全風險進行分析,提出了降低物和人的不安全因素等相關措施;彭麗宇[ 1 ]總結了鐵路貨運運營風險的影響因素,并運用數據知識化方法對人、機、管、環四大維度的影響因素進行深入分析。
(二)機器學習風險預警模型相關研究
通過對機器學習風險預警模型相關文獻進行梳理,發現其主要預警模型涉及決策樹、神經網絡、SVM算法及隨機森林等,此外還包括一些改進算法。
Korol[ 7 ]對比分析了多種風險預警方法的應用效果,包括判別分析法、人工神經網絡與隨機森林模型等,最終結果表明隨機森林模型在財務預警過程中比其他方法的效果更優;李進[ 8 ]以重污染行業上市公司為研究對象,構建了基于隨機森林算法的綠色信貸風險評估模型,建立了較為全面和綜合的評估指標體系,預測結果表明該評估模型與傳統模型相比具有更高的預測準確率;葉曉楓和魯亞會[ 9 ]基于企業信用特征對企業信用風險進行評估,創新性地將隨機森林與樸素貝葉斯相融合,評估效果良好;馬曉君等[ 10 ]利用機器學習算法對我國上市公司信用等級進行預測,考慮到傳統機器學習模型在預警研究中的局限性,選擇利用粒子群算法對隨機森林模型進行改進,實現隨機森林模型超參數的全局調優,大大提高了模型預測精度。
(三)文獻述評
在鐵路貨運運營風險的相關研究中,國內外學者從不同維度進行了探討:首先,對鐵路貨運運營風險管理的相關概念進行界定;其次,基于統計學方法,聚焦鐵路貨運企業在運營過程中的安全風險及人、機、物、管、環等方面對其運營風險進行深入研究。這為后續鐵路貨運企業運營風險預警奠定了理論基礎。
在機器學習風險預警模型相關研究中,國內外學者針對不同行業,立足于管理角度,運用多種機器學習模型實現風險預警,并取得不錯的效果,因此筆者有理由相信機器學習算法在實現A鐵路貨運公司運營風險預警中有著巨大的潛力。
三、A鐵路貨運公司運營管理現狀
(一)公司運營管理流程分析
當前,A鐵路貨運公司(簡稱A公司)鐵路運輸業務主要以提供煤炭、焦炭運輸服務為主,隨著集團多式聯運、智慧物流產業板塊的大力開展,還包含了少許非煤貨物的運輸服務。基于A公司所制定的《鐵路運輸管理規程》和《內部控制手冊》,鐵路運輸業務運營管理流程包含八大環節,即調度計劃、市場開發、合同管理、物資采購、回款、運營分析、研發投入、內控管理,前六大環節的具體實施流程及相關關系如圖1所示。
(二)公司關鍵運營風險點分析
基于上述運營管理流程的梳理,參考公司《風險管理手冊》,進一步分析各環節所面臨的關鍵風險點,如表1所示。對標運營管理業務環節,明確各業務環節風險名稱及風險內容,最終形成十大運營管理關鍵風險點。基于風險導向原則,該十大關鍵風險點也將為下文運營風險預警指標體系維度構建提供可靠的依據。
四、A鐵路貨運公司運營風險預警模型構建與分析
(一)模型構建總體思路
本文運營風險預警模型構建總體思路如圖2所示。
(二)運營風險預警指標體系構建
本文基于上述公司關鍵運營風險點,在指標構建原則上以風險判定為基礎,衡量風險發生的可能性及其對公司的影響程度,著重關注運營過程中風險較高的業務環節,進而圍繞運營業務八大控制環節的十大關鍵風險點構建指標體系。
在指標配置上,以公司《風險管理手冊》和《內部控制手冊》為指導,從調度管理、競爭力水平、合同管理、采購與供應商管理、應收賬款管理、資金運營效率管理、運力資源管理、人力資源管理、研發管理及內控管理十大維度選取39個具體指標對鐵路貨運企業運營風險進行全面評價,具體指標名稱和指標功能如表2所示。
(三)數據來源與樣本選取
公司運營風險研究相關數據的獲取以公司統建系統、各部門業務系統、駕駛艙系統等信息系統中所涉及的相關歷史業財數據為數據來源,全面涵蓋運營風險預警指標體系所需要的數據,具體數據來源如表3。
采集8家分公司2018—2022年各月份的相關業財數據和各部門內部管理數據,外部市場環境獲取相關行業公開數據,并利用機器學習算法對所采集到的數據進行預處理,經數據清洗(填補空值、異常值處理、統一格式)后,共得到480條樣本數據作為指標數據集。
(四)基于K-Means的運營風險聚類分析
公司目前的相關業財數據和管理數據并未直接體現運營風險高低,所以在運營風險預警評價過程中無法獲取一定的先驗知識,而K-Means聚類算法是一種典型的無監督學習,能夠提供可靠性很高的先驗知識,方便后續運用隨機森林算法實現運營風險預警的模型構建。
本文將清洗后的2018—2022年各分公司初始樣本數據投入K-Means模型中進行訓練,深入挖掘數據間關系,初步將所有樣本劃分為三類(標簽0、1和2),得到不同標簽(不同運營風險等級)下各指標的聚類中心。通過觀察可以發現,標簽為0的聚類中心絕大部分業務特征指標明顯優于其他兩類。例如標簽為0的樣本中,采購計劃提報準確率為0.80700776,大于標簽為1或2下的采購計劃提報率;審計整改完成率為0.80371897,大于標簽為1或2下的審計整改完成率等;同理,其他絕大部分維度指標優于另外兩類標簽。因此,排除極個別干擾因素的影響,本文判定劃分為標簽0的樣本為低運營風險樣本。比較標簽1與標簽2的樣本特征和聚類中心,最終判定劃分為標簽1的樣本為中運營風險樣本,劃分為標簽2的樣本為高運營風險樣本。
聚類可視化結果如圖3所示,其中左下角樣本點代表低運營風險(標簽0),右上角樣本點代表中運營風險(標簽1),頂端樣本點代表高運營風險(標簽2),相同顏色即為同一類別(展現了相同的數據特征和運營風險特征),三個類別之間可明確區分,且同一類別標簽樣本的集中度較好,表現出良好的聚類結果。
(五)基于隨機森林算法的運營風險預警分析
隨機森林算法是機器學習模型中比較常用的一種集成算法,也是一種有監督學習算法,它可以處理非線性數據,不易陷入過擬合,其結果對缺失數據和不平衡數據具有較好的抗干擾性,同時能在不顯著增加計算量的情況下改善預測精度,適用于高維數據,被認為是目前性能較好的算法,因此本文選用隨機森林算法實現A公司運營風險預警。
本文將480個樣本數據按照3:7的比例隨機劃分為測試集和訓練集,通過訓練集樣本數據對隨機森林模型進行參數調優,得到最優參數下的最優模型,如表4所示。參數調優主要選用常用的網格搜索交叉驗證(GridSearch)的方法,隨后利用測試集樣本數據驗證模型運營風險預警結果的準確性和模型有效性。其中,驗證模型有效性主要采用混淆矩陣及其二級指標準確率Accuracy、精確率Precision、F1值和AUC值等方法。測試集混淆矩陣及模型有效性評價相關輸出結果如表5、表6所示。
通過上述結果可以發現,訓練得到最優參數criterion為Gini(基尼系數),max_feature為39,n_estimators為110,此時模型為最優模型;網格測試集中絕大多數樣本位于混淆矩陣對角線,表明模型預測運營風險等級與實際運營風險等級高度吻合,預測效果良好;測試集正確率達95%以上,各項混淆矩陣二級指標結果較優,進一步證實了模型運營風險預警結果的準確性和模型的高效性。
五、A鐵路貨運公司運營風險管控建議
基于上述模型訓練,本文得到運營風險預警業務特征重要性排序結果,如圖4所示。重要度越高的業務特征越容易導致運營風險發生,這些業務特征也是A公司運營管理過程中關注的重點。基于此,本文針對A公司運營過程中的相關風險提出相應的管控措施。
由圖4可知,應收賬款賬齡≥3年特征重要度最高,達到0.065081。從前十大運營風險預警指標出現次數及隸屬維度來看,有三個指標隸屬于采購與供應商管理維度,有兩個指標隸屬于調度管理指標維度,人力資源管理維度、內控管理維度、合同管理維度緊隨其后。據此將應收賬款管理、采購與供應商管理、調度管理作為運營風險的管控重點。
(一)應收賬款風險管控措施
近年來,國務院國資委要求中央企業進一步壓減應收賬款,A公司作為中央企業,應在國資委全方位考核機制下,增強抵御風險能力,努力實現總體效益穩定增長。
在事前防范階段,信用管理部門需建立并及時更新客戶信用檔案,根據客戶的各項財務指標與信用指標建立綜合評分體系,為企業的信用管理提供科學依據。在事中監控階段,公司有必要建立完善的全流程賒銷控制制度,保持對客戶信用狀況與財務狀況的實時跟蹤;落實內部控制制度,定期開展應收賬款對賬、供應商對賬工作,及時發現差異、查明原因并糾正;及時開展應收賬款分析工作,建立應收款項臺賬管理制度。在事后收尾階段,對逾期應收賬款管理,各部門、中心及各分公司對應收賬款進行限額控制,明確各部門責任,落實相關責任人催收欠款。對到期的應收款項,及時提醒客戶依約付款;對逾期的應收款項,應當采取多種方式進行催收;對重大的逾期應收款項,可以通過訴訟方式解決;對未清回欠款,根據欠款逾期相關制度,采取有效措施追回或清理,并按照考核機制進行考核和獎懲。
(二)采購與供應商管理風險管控措施
在采購與供應商管理維度,采購計劃執行偏差率和供應商信用情況良好占比兩個指標特征排序靠前,即對運營風險的形成具有強驅動作用。
對采購計劃而言,需加強物資需求計劃的準確性和采購計劃的科學性。物資需求計劃的提報部門應做好需求物資的摸底、統計與計劃工作,以便采購部門集中利用市場供應資源,最大限度發揮規模優勢,通過集中采購來降低采購成本。
對供應商管理而言,需強化供應商管理,培育戰略伙伴,建立合理競爭機制。在物資采購管理中完善供應商資源庫,明確準入條件,實行動態管理,運用集團公司建立的供應商績效考評信息系統(SRM系統),統一對供應商績效表現進行考核評價,與所供物資存在嚴重質量問題或惡意報價的供應商中止合作關系。
(三)調度管理風險管控措施
在調度管理維度,調度日(班)計劃兌現率、低效和無效車輛資產占比兩個指標特征排序靠前,即對運營風險的形成具有強驅動作用。
針對調度計劃風險管理,嚴格實現兩班計劃及調度會議制度。第一班調度日計劃依據月度生產經營計劃,結合實際運輸生產及重點任務情況而制定,第二班計劃需根據第一班計劃的執行情況及時進行調整。
針對貨車資源配置,需根據集團運輸規劃和公司機車車輛檢修、大物流、軌道機械裝備施工計劃,掌握生產進度,落實生產任務目標,充分利用信息化技術整合分公司和三級單位的信息,使其密切配合,提高運輸效率和效益。
六、研究主要貢獻及結論
本文基于機器學習的運營風險預警模型,旨在及時、高效地識別鐵路貨運企業在日常經營過程中的關鍵運營風險點,使其能在管理決策中得到預警提示;同時,進一步挖掘公司運營風險產生的根源,尋找可能存在于調度、采購、合同、財務等各業務維度的異常狀況,從而實現風險預警前移,有針對性地對運營風險進行整改。本文的主要結論如下:
(一)運營風險預警指標體系具有可行性
本文基于鐵路貨運企業業務特點,從調度管理、競爭力水平、合同管理、采購與供應商管理、應收賬款管理、資金運營效益、運力資源管理、人力資源管理、研發管理及內控管理十大維度建立了運營風險預警指標體系,充分反映企業運營狀況,具有一定的可行性。
(二)基于隨機森林的運營風險預警具有較好的預測效果
隨機森林模型訓練結果表明,當max_features為39,n_estimators為110時,模型運營風險預警效果最優,此時測試集預測準確率達到95.14%,精確度、召回率、F1值和AUC值均高于90.00%,進一步驗證了模型的預警效果和泛化能力,企業可以根據自身情況選用本運營風險預警模型,這對企業管理者加強企業運營風險管理有較大的幫助。
(三)及時關注應收賬款、采購與供應商和調度管理維度的運營風險
依據重要特征度排序結果,前十大運營風險預警指標中,應收賬款管理、采購與供應商管理和調度管理出現頻率最高。據此,公司在運營過程中需及時關注應收賬款管理、采購與供應商管理和調度管理所面臨的風險,及時控制和處理可能存在的風險,以預防和減少公司損失,確保鐵路貨運安全、暢通。
【參考文獻】
[1] 彭麗宇.鐵路貨運運營風險數據知識化方法研究[D].北京:北京交通大學博士學位論文,2019.
[2] SILLA A,KALLBERG V P.The development of railway safety in Finland[J].Accident Analysis amp; Prevention,2012,45(2):737-744.
[3] MUTTRAM R I.Railway safety's safety risk mode[J].Proceedings of the Institution of Mechanical Engiueers,Part F:Journal of Rail and Rapid Transit,2002,216(2):71-79.
[4] JAFARIAN,REZVANI M A.Application of fuzzy fault train analysis for evaluation of railway safety risks:an evaluation of root causes for passenger train derailment[J].Proceeding of the Institution of Mechanical Engineers,Part F:Journal of Rail and Rapid Transit,2012,226(1):14-15.
[5] 呂峰.鐵路安全風險管理對策的探討[J].鐵道運輸與經濟,2014,36(12):38-41.
[6] 許妙榅.安全風險管理在鐵路貨車段修工作中的應用研究[R].北京:中國鐵道科學研究院,2016.
[7] KOROL T.Early warning models against bankruptcy risk for Central European and Latin American enterprises[J].Economic Modelling,2013,31:22-30.
[8] 李進.基于隨機森林算法的綠色信貸信用風險評估研究[J].金融理論與實踐,2015(11):14-18.
[9] 葉曉楓,魯亞會.基于隨機森林融合樸素貝葉斯的信用評估模型[J].數學的實踐與認識,2017,47(2):68-73.
[10] 馬曉君,董碧瀅,王常欣.一種基于PSO優化加權隨機森林算法的上市公司信用評級模型設計[J].數量經濟技術經濟研究,2019,36(12):165-182.