





















摘要:針對傳統(tǒng)大宗商品供應(yīng)鏈風(fēng)險識別方法的識別角度不全面,識別結(jié)果準確度較低等問題,采用文本挖掘方法,建立包括數(shù)據(jù)采集及語料庫構(gòu)建、數(shù)據(jù)預(yù)處理、風(fēng)險識別的大宗商品供應(yīng)鏈風(fēng)險識別模型框架,從中國知網(wǎng)、萬方數(shù)據(jù)知識服務(wù)平臺中獲取大宗商品供應(yīng)鏈管理相關(guān)研究文獻,構(gòu)建包含不同文獻數(shù)的3個語料庫,對語料庫數(shù)據(jù)進行詞頻分析、N-gram分析、相關(guān)性分析、累計詞頻-信息熵(term frequency-information entropy,TF-H)降維及潛在狄利克雷分配(latent Dirichlet allocation,LDA)主題建模,并將風(fēng)險識別結(jié)果與傳統(tǒng)供應(yīng)鏈風(fēng)險識別方法的識別結(jié)果進行對比,驗證方法的有效性。結(jié)果表明:通過LDA主題模型生成20個大宗商品供應(yīng)鏈風(fēng)險主題,每個主題從不同角度展示當(dāng)前大宗商品供應(yīng)鏈面臨的風(fēng)險,將識別出的大宗供應(yīng)鏈風(fēng)險分為市場風(fēng)險、物流風(fēng)險、金融風(fēng)險、環(huán)境風(fēng)險、管理風(fēng)險、合作風(fēng)險6種類型;文本挖掘方法與其他傳統(tǒng)風(fēng)險識別方法的風(fēng)險識別結(jié)果具有較強的耦合度,且識別維度更全面、識別結(jié)果更準確。文本挖掘技術(shù)可全面、準確地識別供應(yīng)鏈風(fēng)險因素,可為大宗商品供應(yīng)鏈風(fēng)險識別提供理論支撐。
關(guān)鍵詞:大宗商品;供應(yīng)鏈管理;風(fēng)險識別;文本挖掘;LDA
中圖分類號:[U-9];TP391.1文獻標志碼:A文章編號:1672-0032(2025)01-0024-11
0 引言
大宗商品供應(yīng)鏈具有交易規(guī)模大、涉及環(huán)節(jié)多、金融屬性強、分布范圍廣、國際化程度高等特點,在經(jīng)濟全球化背景下,大宗商品供應(yīng)鏈網(wǎng)絡(luò)面臨較大風(fēng)險[1]。黨的二十大報告提出:“加快建設(shè)現(xiàn)代化經(jīng)濟體系,著力提高全要素生產(chǎn)率,著力提升產(chǎn)業(yè)鏈供應(yīng)鏈韌性和安全水平”。《“十四五”現(xiàn)代物流發(fā)展規(guī)劃》提出:“加快構(gòu)建全球供應(yīng)鏈物流服務(wù)網(wǎng)絡(luò),保持產(chǎn)業(yè)鏈供應(yīng)鏈穩(wěn)定”。研究大宗商品供應(yīng)鏈風(fēng)險管理,引導(dǎo)制造企業(yè)與物流企業(yè)建立互利共贏的長期戰(zhàn)略合作關(guān)系,加快物流樞紐資源整合,構(gòu)建國際國內(nèi)物流大通道。
在研究大宗商品供應(yīng)鏈特性方面,尹志[2]采用向量自回歸模型分析國際大宗商品價格波動對我國經(jīng)濟的影響,并提出應(yīng)對策略;方先明等[3]采用時變參數(shù)的向量自回歸模型,檢驗地緣沖突風(fēng)險對我國農(nóng)產(chǎn)品期貨價格沖擊的時變特征;宋華等[4]探索金融科技平臺如何幫助金融機構(gòu)提高對中小企業(yè)信用風(fēng)險的評估能力,推動實現(xiàn)供應(yīng)鏈金融創(chuàng)新模式。大宗商品供應(yīng)鏈特性決定供應(yīng)鏈風(fēng)險類型復(fù)雜多樣,易受內(nèi)、外部環(huán)境影響,可根據(jù)大宗商品供應(yīng)鏈特性識別風(fēng)險因素。
作為供應(yīng)鏈風(fēng)險管理的起點,供應(yīng)鏈風(fēng)險識別是供應(yīng)鏈風(fēng)險評估和控制的前提。風(fēng)險識別準確性和完整性直接影響風(fēng)險評估和控制的效果和效率。傳統(tǒng)的供應(yīng)鏈風(fēng)險識別方法包括文獻分析法、故障樹分析法、德爾菲法、供應(yīng)鏈運作參考(supply-chain operations reference,SCOR)模型等。張敏等[5]等分層歸類農(nóng)產(chǎn)品直播電商供應(yīng)鏈風(fēng)險因素,采用決策試驗與評價實驗法分析因素間的相互作用,通過ABC分類法識別關(guān)鍵風(fēng)險因素;李國亮[6]采用SCOR模型從計劃、采購、生產(chǎn)、配送、退貨等環(huán)節(jié)識別企業(yè)供應(yīng)鏈風(fēng)險;Cao等[7]通過整合環(huán)境、經(jīng)濟和社會因素,提出可持續(xù)供應(yīng)鏈運營綜合決策模型,為平衡供應(yīng)鏈運作中可持續(xù)發(fā)展目標與企業(yè)盈利目標提供決策工具和策略建議;謝樂[8]以“農(nóng)超對接”為研究對象,基于貝葉斯網(wǎng)絡(luò)構(gòu)建“農(nóng)超對接”供應(yīng)鏈風(fēng)險預(yù)警模型,結(jié)合實證分析識別“農(nóng)超對接”供應(yīng)鏈的主要風(fēng)險因素;Aqlan等[9]結(jié)合專家知識、供應(yīng)鏈結(jié)構(gòu)、調(diào)查訪問數(shù)據(jù)等識別供應(yīng)鏈潛在風(fēng)險。傳統(tǒng)的供應(yīng)鏈風(fēng)險識別方法和數(shù)據(jù)來源存在一定局限性和主觀性,由于數(shù)據(jù)多為人工采集和整理,限制了樣本數(shù)和風(fēng)險識別的角度。大宗商品貿(mào)易交易環(huán)節(jié)越復(fù)雜,交易工具種類越多,貿(mào)易業(yè)務(wù)風(fēng)險表現(xiàn)形式越隱蔽,傳統(tǒng)的風(fēng)險識別方法易出現(xiàn)識別角度不全面、識別結(jié)果不準確等問題。
隨著人工智能和大數(shù)據(jù)技術(shù)的發(fā)展,在風(fēng)險識別中可采用多種方法挖掘分析海量數(shù)據(jù),精準識別風(fēng)險。Hassan[10]通過機器學(xué)習(xí)方法識別汽車供應(yīng)鏈風(fēng)險,優(yōu)化供應(yīng)鏈管理模式;牛莉霞等[11]通過大數(shù)據(jù)技術(shù)構(gòu)建數(shù)據(jù)感知-數(shù)據(jù)分析-數(shù)據(jù)服務(wù)一體化的煤礦安全風(fēng)險治理模式,提高煤礦風(fēng)險識別效率和治理能力;Zhao等[12]等通過網(wǎng)絡(luò)爬蟲技術(shù)爬取石油市場新聞數(shù)據(jù),采用潛在狄利克雷分配(latent Dirichlet allocation,LDA)識別石油供應(yīng)鏈的28個風(fēng)險主題;劉心男等[13]采用文本挖掘法分析建設(shè)工程質(zhì)量檢測機構(gòu)檢查報告,識別建設(shè)工程檢測質(zhì)量風(fēng)險,檢測工作合規(guī)風(fēng)險。人工智能和大數(shù)據(jù)技術(shù)為供應(yīng)鏈風(fēng)險識別提供更科學(xué)的視角和工具,使風(fēng)險管理從傳統(tǒng)的經(jīng)驗判斷和定性分析轉(zhuǎn)向數(shù)據(jù)驅(qū)動決策。人工智能和大數(shù)據(jù)技術(shù)在風(fēng)險識別領(lǐng)域已取得一定成果,但從大宗商品出發(fā)識別供應(yīng)鏈風(fēng)險的研究較少。
本文基于文本挖掘方法,采用詞頻分析、N-gram分析、相關(guān)性分析識別大宗商品供應(yīng)鏈風(fēng)險,將信息熵引入特征權(quán)重評價,克服詞頻-逆文檔頻率法(term frequency-inverse document frequency,TF-IDF)在提取特征時未考慮關(guān)鍵詞出現(xiàn)頻率和分布的問題,通過累計詞頻-信息熵(term frequency-information entropy,TF-H)方法對語料庫降維,采用LDA實現(xiàn)主題建模,對大宗商品供應(yīng)鏈風(fēng)險進行識別與分類,以期為大宗商品供應(yīng)鏈風(fēng)險識別提供更科學(xué)的工具和方法。
1 大宗商品供應(yīng)鏈風(fēng)險識別模型框架
大宗商品供應(yīng)鏈風(fēng)險識別模型框架包括數(shù)據(jù)采集及語料庫構(gòu)建、數(shù)據(jù)預(yù)處理、風(fēng)險識別三部分,具體框架如圖1所示。
從中國知網(wǎng)、萬方數(shù)據(jù)知識服務(wù)平臺中檢索與大宗商品供應(yīng)鏈管理相關(guān)的文獻構(gòu)建語料庫數(shù)據(jù)。通過2個數(shù)據(jù)庫的高級檢索功能,將檢索主題限定為“大宗商品”和“供應(yīng)鏈”,時間設(shè)定為2000—2023年,人工篩除相關(guān)性較小的文獻后,共得到653篇文獻存入語料庫A。在數(shù)據(jù)挖掘領(lǐng)域,數(shù)據(jù)越多,結(jié)果越客觀,但文本挖掘中的關(guān)聯(lián)規(guī)則計算機制與傳統(tǒng)的關(guān)聯(lián)分析不同,相關(guān)性表示2個術(shù)語在同一文獻中共同出現(xiàn)的頻次,隨文獻數(shù)增大,共現(xiàn)頻率可能會被稀釋。將檢索主題進一步限定為“大宗商品”“供應(yīng)鏈”“風(fēng)險”,時間不變,將語料庫A進一步減少為包含106篇文獻的語料庫B[14]。
語料庫A、B文獻的基本屬性如表1~5所示,僅統(tǒng)計語料庫樣本數(shù)據(jù)排名前5的屬性類別。
為獲得更顯著的相關(guān)性結(jié)果,通過充分閱讀,人工篩選與大宗供應(yīng)鏈風(fēng)險主題高度相關(guān)的12篇文獻存入語料庫C,其文獻主題為大宗商品貿(mào)易、供應(yīng)鏈風(fēng)險,學(xué)科分布前3名分別為企業(yè)經(jīng)濟、工業(yè)經(jīng)濟、貿(mào)易經(jīng)濟。3個語料庫除了相關(guān)性有差異,分析結(jié)果均穩(wěn)定。采用Python編程語言實現(xiàn)文本數(shù)據(jù)處理、結(jié)果分析和可視化。
2 大宗商品供應(yīng)鏈風(fēng)險識別方法
2.1 數(shù)據(jù)預(yù)處理
在風(fēng)險識別前需進行數(shù)據(jù)預(yù)處理,對語料庫調(diào)優(yōu),保證模型識別結(jié)果的準確性和全面性。數(shù)據(jù)預(yù)處理包括專業(yè)詞庫構(gòu)建、格式清除、停用詞處理和中文分詞。
中文分詞采用結(jié)巴分詞庫中的精準模式,但分詞庫缺乏對大宗商品供應(yīng)鏈風(fēng)險管理領(lǐng)域的知識,分詞結(jié)果易出現(xiàn)將專業(yè)名詞分割的情況,如,將“區(qū)塊鏈”分為“區(qū)塊”和“鏈”。構(gòu)建專業(yè)詞庫實現(xiàn)精準分詞,通過搜集整理搜狗細胞詞庫中的《物流詞匯大全》《交通運輸》《國際貿(mào)易名詞》《外貿(mào)詞匯大全》等多個相關(guān)領(lǐng)域詞庫,去除相同詞作為專業(yè)詞庫[15];格式清除可提高分詞準確性和分詞效率,清除文本中存在的英文、數(shù)字、標點符號、空格等;停用詞處理是通過停用詞詞庫過濾文本中無意義的詞[16],停用詞詞庫包含《哈工大停用詞表》及“摘要”“參考文獻”等文獻常見但無實際意義的詞;最后通過結(jié)巴分詞完成數(shù)據(jù)預(yù)處理。
2.2 詞頻及術(shù)語相關(guān)性分析
文獻-術(shù)語矩陣是計算術(shù)語頻率和術(shù)語間相關(guān)性的方法[17]。語料庫C中12篇文獻按術(shù)語頻率排序的文獻-術(shù)語矩陣熱力圖如圖2所示,圖中矩陣行向量為語料庫C中的文獻,列向量為語料庫C中出現(xiàn)頻率排名前10位的術(shù)語。通過文獻-術(shù)語矩陣分析可獲得某術(shù)語在語料庫和單篇文獻中出現(xiàn)的頻數(shù),分析大宗供應(yīng)鏈風(fēng)險相關(guān)文獻,推導(dǎo)重要的風(fēng)險因素及相關(guān)術(shù)語。
術(shù)語間的相關(guān)性也是識別風(fēng)險因素的重要方法之一,將某術(shù)語與術(shù)語“風(fēng)險”共現(xiàn)的文獻數(shù)除以包含術(shù)語“風(fēng)險”的總文獻數(shù)得到共現(xiàn)相關(guān)性得分,該得分反映某術(shù)語與術(shù)語“風(fēng)險”間的關(guān)聯(lián)強度,分數(shù)越高,與“風(fēng)險”的關(guān)系越緊密。
N-gram分析是自然語言處理中的常用方法[18],通過分析和計量文本中連續(xù)的N個項(如單詞或字符)序列的出現(xiàn)頻率,揭示術(shù)語間的潛在關(guān)系;其中Bi-gram是將文本中相鄰的2個詞作為1個單元進行分析。本文采用Bi-gram分析進一步挖掘術(shù)語“風(fēng)險”與其他術(shù)語間的聯(lián)系。
2.3 特征提取及降維
在文本挖掘領(lǐng)域,特征是數(shù)據(jù)集中獨立變量,TF-IDF是使用最普遍的特征參數(shù)項統(tǒng)計方法[19],若某術(shù)語在某文獻中出現(xiàn)頻率較大,在整個語料庫出現(xiàn)頻率較小時,認為該術(shù)語的重要性較高,但該方法在提取特征時未考慮術(shù)語分布問題,TF-H算法將信息熵H引入特征權(quán)重評價中,可有效解決此問題[20]。
假設(shè)術(shù)語Si分布在m篇文獻中,Si在語料庫中的概率分布
式中T ij為術(shù)語Si在第j篇文獻中出現(xiàn)的頻數(shù)。
術(shù)語Si在文獻中分布程度的信息熵H(Si)=-∑pilog pi。
術(shù)語Si的H(Si)越大,隨機性越大,風(fēng)險因素發(fā)生的不確定性越大。結(jié)合詞頻和信息熵,術(shù)語Si的詞頻-信息熵ω(Si)=T ijH(Si)=-T ij∑pilog pi。
文獻較多時,特征參數(shù)的維度會過高,干擾后續(xù)分析,需對特征項降維處理。相較于傳統(tǒng)的累計熵權(quán)詞頻和高頻詞界定公式等,累計TF-H法是將帕累托分析法的概念引入累計詞頻中,能更準確地篩除重要程度低的特征值。在該方法中,將所有特征項按詞頻-信息熵降序排列,計算每個特征項的詞頻-信息熵的累計百分比,保留累計百分比位0~90%的特征項,剔除其余特征項,減少維度,保留關(guān)鍵特征。特征項詞頻-信息熵分布如圖3所示。
2.4 LDA主題模型
LDA是從文本數(shù)據(jù)中提取主題的概率生成模型[21]。假設(shè)每個文獻由多個主題組成,每個主題由詞組的概率分布組成,通過推斷文獻中的主題分布和主題中的單詞分布實現(xiàn)主題聚類,LDA主題模型運行原理如圖4所示。
對模型中的每篇文獻,基于α選擇θ,對文獻中的每個詞項從θ中選擇Z,從與該主題相關(guān)聯(lián)的Φ中選擇W,重復(fù)以上過程,直到文獻的所有詞項分配主題。
LDA主題模型需預(yù)設(shè)主題數(shù),通過試驗確定合適的主題數(shù),常見方法是訓(xùn)練多個LDA主題模型,每個模型采用不同的主題數(shù),計算每個LDA主題模型的主題困惑度[22]。主題困惑度是衡量模型性能的重要指標之一,主題困惑度越小,模型的預(yù)測能力越好。比較不同模型的主題困惑度,確定最優(yōu)主題數(shù)。主題困惑度
式中:K為主題數(shù),P(Zi|d)為給定文獻d時主題Zi的條件概率,P(Wd,n|Zi)是給定Zi時詞項Wd,n的條件概率。
3 結(jié)果分析
3.1 大宗商品供應(yīng)鏈風(fēng)險識別
對3個語料庫進行詞頻分析、相關(guān)性分析和LDA主題建模,基于文獻關(guān)聯(lián)規(guī)則機制,語料庫術(shù)語越多,相關(guān)性越低,需縮減語料庫規(guī)模。3個語料庫的概要如表6所示,經(jīng)預(yù)處理后,語料庫中的字符數(shù)和特征數(shù)均顯著減少。
3個語料庫的維恩圖如圖5所示。圖5展示3個語料庫詞頻最高的前50個詞間的邏輯關(guān)系,語料庫A、B、C各有6、6、26個獨立元素;語料庫A和B有21個共同元素,語料庫A和C有1個共同元素;語料庫B和C有1個共同元素;語料庫A、B、C有22個共同元素。
3個語料庫的詞頻可視化分析如圖6所示。由圖6可知:3個語料庫相互獨立,但有較多相同術(shù)語,如“大宗商品”“供應(yīng)鏈”“風(fēng)險”“物流”等。說明隨文獻數(shù)的增多,語料庫的主題未偏離,3個語料庫均為識別大宗商品供應(yīng)鏈風(fēng)險的有效數(shù)據(jù)。
通過文獻-術(shù)語矩陣分析術(shù)語“風(fēng)險”與其他術(shù)語間的相關(guān)性,檢查相關(guān)性較大的術(shù)語,篩選得到87個與“風(fēng)險”相關(guān)性較高的術(shù)語,按相關(guān)性從高到低排列,結(jié)果如表7所示。
以相關(guān)性較高的術(shù)語“價格”為例分析對供應(yīng)鏈風(fēng)險管理的影響,價格是大宗商品供應(yīng)鏈管理中的重要部分,可從多方面影響供應(yīng)鏈的穩(wěn)定性。大宗商品的價格通常受市場供需、貨幣政策等多種因素影響,大宗商品企業(yè)通常采用衍生工具,如期貨合約對沖價格風(fēng)險,但大宗商品價格極端波動會使套期保值困難,增加套期保值成本,影響企業(yè)風(fēng)險管理效率。
通過Bi-gram分析識別某術(shù)語與術(shù)語“風(fēng)險”連續(xù)出現(xiàn)的頻率,如“管理風(fēng)險”“政策風(fēng)險”“數(shù)據(jù)風(fēng)險”等,按出現(xiàn)頻率從高到低排列,結(jié)果如表8所示。
Bi-gram網(wǎng)絡(luò)圖能直觀展示術(shù)語間的關(guān)系,快速識別供應(yīng)鏈風(fēng)險的關(guān)鍵術(shù)語及術(shù)語間關(guān)系。Bi-gram分析網(wǎng)絡(luò)圖如圖7所示。每個節(jié)點代表1個術(shù)語,節(jié)點間的線(邊)表示這些術(shù)語的共現(xiàn)關(guān)系,圓圈表示出現(xiàn)頻率較高的節(jié)點。圖中物聯(lián)網(wǎng)技術(shù)和區(qū)塊鏈技術(shù)是大宗商品貿(mào)易常用的2項技術(shù);俄烏沖突和新冠疫情分別反映地緣沖突和公共衛(wèi)生事件對大宗商品供應(yīng)鏈的影響;世界經(jīng)濟、全球經(jīng)濟、中國經(jīng)濟反映大宗商品供應(yīng)鏈的全球化特點。
不同語料庫間的文獻數(shù)差異較大,語料庫A主題數(shù)過多,主題聚類結(jié)果的解釋性減弱,語料庫C主題信息較少,選擇語料庫B進行LDA主題建模。LDA主題建模前,需通過累計TF-H算法對語料庫降維處理,“風(fēng)險”“供應(yīng)鏈”“大宗商品”等術(shù)語出現(xiàn)在語料庫的大多數(shù)文獻中,詞頻-信息熵較低,這些詞在主題建模時不重要,將此類分詞加入停用詞列表。降維后,語料庫B特征數(shù)從20 411減至5 194。
計算不同主題數(shù)下的LDA主題模型困惑度,并繪制曲線,根據(jù)pyLDAvis可視化的主題效果圖確定最佳主題數(shù)[23]。困惑度越小,LDA主題模型效果越好,但困惑度太小易出現(xiàn)模型過擬合問題,困惑度隨主題數(shù)變化趨勢曲線中的拐點可反映某主題數(shù)下LDA主題模型泛化能力的提高。pyLDAvis可視化主題效果圖中,氣泡代表主題,氣泡大小反映該主題在數(shù)據(jù)集中出現(xiàn)的頻率,PC1和PC2表示通過多維尺度分析降維后的兩個主要維度,用來可視化高維空間中主題間距離的低維表示。通過多維縮放方法確定氣泡的位置,在二維平面上展示主題間的距離關(guān)系,主題靠得越近,語義越相似。
LDA主題模型困惑度隨主題數(shù)的變化趨勢如圖8所示。由圖8可知:隨主題數(shù)增多,LDA主題模型的困惑度整體呈下降趨勢;主題數(shù)增至13后,困惑度的變化趨于平緩并逐漸穩(wěn)定。將曲線中出現(xiàn)明顯拐點的主題數(shù)13、14、18、19、20、23、27分別輸入LDA主題模型進行試驗,通過pyLDAvis將結(jié)果可視化。主題數(shù)為13、14、18、19、23、27時,pyLDAvis可視化主題效果圖中出現(xiàn)明顯的象限分布不均勻、主題重合的情況。主題數(shù)為20時的可視化結(jié)果如圖9所示,主題氣泡交叉情況較少且象限分布均勻,主題間相對獨立,因此確定最優(yōu)主題數(shù)為20。
通過LDA主題模型生成20個大宗商品供應(yīng)鏈風(fēng)險主題,每個主題列出7個關(guān)鍵詞,結(jié)果如表9所示。
LDA主題模型揭示語料庫B中文獻的主要主題,每個主題從不同角度展示當(dāng)前大宗商品供應(yīng)鏈面臨的風(fēng)險,如,“地震”“海嘯”“中斷”等關(guān)鍵詞從自然災(zāi)害角度反映大宗商品供應(yīng)鏈面臨的風(fēng)險;“倉單質(zhì)押”“應(yīng)收賬款”等關(guān)鍵詞從金融服務(wù)角度反映大宗商品供應(yīng)鏈面臨的風(fēng)險;“戰(zhàn)略”“決策”“管理”等關(guān)鍵詞從企業(yè)經(jīng)營角度反映大宗商品供應(yīng)鏈面臨的風(fēng)險。
3.2 大宗商品供應(yīng)鏈風(fēng)險識別結(jié)果分類及對比
基于詞頻分析、相關(guān)性分析、N-gram分析和LDA主題建模的結(jié)果,將大宗供應(yīng)鏈風(fēng)險分為市場風(fēng)險、物流風(fēng)險、金融風(fēng)險、環(huán)境風(fēng)險、管理風(fēng)險、合作風(fēng)險6種類型,每種供應(yīng)鏈風(fēng)險類型下又根據(jù)關(guān)鍵詞細分具體的風(fēng)險因素,結(jié)果如表10所示。
傳統(tǒng)供應(yīng)鏈風(fēng)險識別方法的識別結(jié)果如表11所示。對比表11結(jié)果可知:本文采用的文本挖掘方法與傳統(tǒng)風(fēng)險識別方法的識別結(jié)果具有較強的耦合度,識別結(jié)果基本包括其他方法識別的供應(yīng)鏈風(fēng)險;文本挖掘方法在基本方向未偏離的基礎(chǔ)上具有豐富的拓展性,識別維度更全面,充分體現(xiàn)大宗商品供應(yīng)鏈特性,如核心企業(yè)風(fēng)險、貨權(quán)風(fēng)險、金融業(yè)務(wù)風(fēng)險是其他風(fēng)險識別結(jié)果未識別出的風(fēng)險。
對文本挖掘識別到的大宗商品供應(yīng)鏈類型和因素按層次結(jié)構(gòu)分類,得到的風(fēng)險類型因素不獨立,幾個風(fēng)險因素或風(fēng)險事件會產(chǎn)生連鎖反應(yīng),影響部分或整個供應(yīng)鏈,供應(yīng)鏈的基本信息和組成(行業(yè)類型、產(chǎn)品類型、涉及地區(qū)等)對發(fā)現(xiàn)這些風(fēng)險因素間的聯(lián)系至關(guān)重要。雖然識別結(jié)果未揭示風(fēng)險因素間的內(nèi)在聯(lián)系,但了解大宗商品供應(yīng)鏈不同的風(fēng)險類型及其潛在風(fēng)險因素至關(guān)重要。
4 結(jié)束語
為識別大宗商品供應(yīng)鏈風(fēng)險,基于文本挖掘方法,提出包括數(shù)據(jù)采集及語料庫構(gòu)建、數(shù)據(jù)預(yù)處理、風(fēng)險識別3部分的大宗商品供應(yīng)鏈風(fēng)險識別模型框架,通過詞頻分析、N-gram分析、相關(guān)性分析、累計TF-H降維及LDA主題建模,識別20個大宗商品供應(yīng)鏈風(fēng)險主題,將識別的大宗商品供應(yīng)鏈風(fēng)險分為市場風(fēng)險、物流風(fēng)險、金融風(fēng)險、環(huán)境風(fēng)險、管理風(fēng)險和合作風(fēng)險6類風(fēng)險類型,與傳統(tǒng)供應(yīng)鏈風(fēng)險識別方法的識別結(jié)果對比可知,文本挖掘方法識別維度更全面,識別結(jié)果更準確。所建立的大宗商品供應(yīng)鏈風(fēng)險識別模型從大數(shù)據(jù)視角出發(fā)為供應(yīng)鏈風(fēng)險識別提供更科學(xué)的工具和方法,使風(fēng)險管理從傳統(tǒng)的經(jīng)驗判斷和定性分析轉(zhuǎn)向更科學(xué)的數(shù)據(jù)驅(qū)動決策。
本文提出的風(fēng)險識別模型框架具有可拓展性和可復(fù)制性,通過更換數(shù)據(jù)源,可有效識別其他領(lǐng)域的供應(yīng)鏈風(fēng)險因素。風(fēng)險識別作為供應(yīng)鏈風(fēng)險管理的第一步,識別結(jié)果直接影響風(fēng)險評估和風(fēng)險控制的效果和效率,未來可基于風(fēng)險識別模型識別的風(fēng)險因素作進一步的風(fēng)險評估和風(fēng)險控制研究。
參考文獻:
[1] 史樂蒙.宋華:大宗商品供應(yīng)鏈必須轉(zhuǎn)型[N].期貨日報,2023-08-28(7).
[2] 尹志.國際大宗商品價格波動及對中國的啟示[J].價格月刊,2023(11):16-22.
[3] 方先明,高元.地緣沖突風(fēng)險、大宗商品金融化與農(nóng)產(chǎn)品期貨價格波動[J].經(jīng)濟問題,2023(6):57-67.
[4] 宋華,韓思齊,劉文詣.數(shù)字化金融科技平臺賦能的供應(yīng)鏈金融模式:基于信息處理視角的雙案例研究[J].管理評論,2024,36(1):264-275.
[5] 張敏,楊閣,史一鳴.直播電商模式下農(nóng)產(chǎn)品直播供應(yīng)鏈風(fēng)險識別與測度研究[J].物流科技,2024,47(17):121-126.
[6] 李國亮.基于SCOR模型的HZDH公司供應(yīng)鏈風(fēng)險識別與控制研究[D].桂林:桂林理工大學(xué),2023.
[7] CAO J, YE X H, QI Y, et al. An integrative decision-making model for the operation of sustainable supply chain in China[J].Energy Procedia,2011,5:1497-1501.
[8] 謝樂.基于貝葉斯網(wǎng)絡(luò)的農(nóng)超對接供應(yīng)鏈風(fēng)險預(yù)警模型研究[D].南昌:江西財經(jīng)大學(xué),2020.
[9] AQLAN F, LAM S S. A fuzzy-based integrated framework for supply chain risk assessment[J].International Journal of Production Economics, 2015,161:54-63.
[10] HASSAN A P. Enhancing supply chain risk management by applying machine learning to identify risks[C]//Proceedings of International Conference on Business Information Systems. Seville, Spain:Springer Nature Switzerland AG, 2019:191-205.
[11] 牛莉霞,趙蕊.大數(shù)據(jù)時代煤礦安全風(fēng)險治理模式研究[J].煤礦安全,2022,53(7):241-245.
[12] ZHAO L T, GUO S Q, WANG Y. Oil market risk factor identification based on text mining technology[J].Energy Procedia, 2019, 158:3589-3595.
[13] 劉心男,王家慧,紀穎波.建設(shè)工程質(zhì)量檢測機構(gòu)運行風(fēng)險管理研究[J].建筑經(jīng)濟,2023,44(11):89-94.
[14] CHU C Y, PARK K, KREMER G E. A global supply chain risk management framework: an application of text-mining to identify region-specific supply chain risks[J].Advanced Engineering Informatics, 2020, 45:101053.
[15] 猶夢潔.基于文本挖掘的煤礦安全風(fēng)險識別與評價研究[D].徐州:中國礦業(yè)大學(xué),2022.
[16] 鄭福,何璐彤,洪靈輝,等.基于文本挖掘的電商平臺茶類商品消費者滿意度研究:京東商城苦丁茶在線評論為例[J].商展經(jīng)濟,2024(4):121-125.
[17] 鄭秀婷.文本隱含氣候風(fēng)險因子定價[D].武漢:華中科技大學(xué),2021.
[18] 林曉鵬.基于N-gram算法的網(wǎng)絡(luò)安全風(fēng)險檢測系統(tǒng)設(shè)計[J].信息與電腦(理論版),2023,35(15):215-217.
[19] 郭家璇.基于TF-IDF算法的貨運平臺車貨供需匹配研究[D].北京:北京交通大學(xué),2022.
[20] XU N, MA L, LIU Q, et al. An improved text mining approach to extract safety risk factors from construction accident reports[J].Safety Science, 2021, 138:105216.
[21] 于勝博.考慮消費者體驗感的生鮮農(nóng)產(chǎn)品配送系統(tǒng)優(yōu)化研究[D].南昌:江西財經(jīng)大學(xué),2021.
[22] 陳芳,陳茜,徐碧晨.基于文本挖掘的管制運行風(fēng)險主題分析[J].中國安全生產(chǎn)科學(xué)技術(shù),2020,16(11):47-52.
[23] 陳芳,溫抗抗,張亞博,等.民航管制安全風(fēng)險主題時空分布規(guī)律研究[J].安全與環(huán)境學(xué)報,2024,24(2):587-595.
[24] 曾堯.大宗商品供應(yīng)鏈管理企業(yè)風(fēng)險管理及其評價研究[D].北京:北京交通大學(xué),2021.
[25] 丁存振,徐宣國.國際糧食供應(yīng)鏈安全風(fēng)險與應(yīng)對研究[J].經(jīng)濟學(xué)家,2022(6):109-118.
[26] 許保光,謝傳勝.煤炭企業(yè)供應(yīng)鏈風(fēng)險識別與控制[J].中國儲運,2024(1):88.
[27] 胡夢婷.基于貝葉斯網(wǎng)絡(luò)的汽車供應(yīng)鏈風(fēng)險識別與評估[J].物流技術(shù),2023,42(8):137-142.
[28] 徐園林.基于貝葉斯網(wǎng)絡(luò)的裝配式建筑供應(yīng)鏈風(fēng)險分析[J].項目管理技術(shù),2024,22(5):125-132.
Risk identification of bulk commodity supply chains
Abstract: To address issues in traditional risk identification methods for commodity supply chains, such as incomplete perspectives and low accuracy of identification results, a text mining approach is employed to establish a bulk commodity supply chain risk identification model framework, which includes data collection, corpus construction, data preprocessing, and risk identification. Research papers related to bulk commodity supply chain management are collected from China National Knowledge Infrastructure(CNKI) and Wanfang Data Knowledge Service Platform. Three corpora with different numbers of texts are constructed. These corpora undergo word frequency analysis, N-gram analysis, correlation analysis, term frequency-information entropy(TF-H) dimensionality reduction, and latent Dirichlet allocation (LDA) topic modeling. The results of the risk identification are compared with those from traditional supply chain risk identification methods to validate the effectiveness of the proposed approach. The results show that the LDA topic model generates 20 bulk commodity supply chain risk topics, each reflecting the risks faced by the current bulk commodity supply chain from different perspectives. The identified risks are categorized into six types: market risk, logistics risk, financial risk, environmental risk, management risk, and cooperation risk. The text mining approach demonstrates a strong correlation with traditional risk identification methods, while offering a more comprehensive identification dimension and more accurate results. Text mining technology can comprehensively and accurately identify supply chain risk factors and provide theoretical support for bulk commodity supply chain risk identification.
Keywords:bulk commodity; supply chain management; risk identification; text mining; LDA