張世良 孫剛 唐良運



摘 要:為了降低特征挖掘結果的漢明損失和錯誤率,提出了一種基于決策樹的供應商全鏈路動態特征挖掘算法.對數據實施數值化、離散化和歸一化處理,通過降低數據值域的差異來降低漢明損失和錯誤率.利用處理后的數據建立決策樹,通過剪枝操作提高了數據分類的精度,采用改進的CHI值和RBF神經網絡有效挖掘全鏈路動態特征.該算法降低了挖掘結果的漢明損失和錯誤率,且分類處理精度、準確率、召回率均有所提高.該算法有效提高了供應商全鏈路動態特征的挖掘效果.
關 鍵 詞:決策樹;供應商;全鏈路特征;數據預處理;剪枝操作;RBF神經網絡;數據分類;動態特征挖掘
中圖分類號:TP399 文獻標志碼:A 文章編號:1000-1646(2023)04-0447-06
供應鏈系統在全球經濟化背景下的發展規模擴大、速度加快,在這種情況下市場環境變得越來越復雜,進而提高了供應鏈系統的風險.同時,供應鏈數據所呈現出的半結構化、非結構化特點增加了大數據環境下數據分析的模式和方法的復雜程度[1],導致采用傳統的人工操作難以對復雜的供應鏈系統進行管理.在目前的全渠道零售模式中,大數據樣本、差異性、相關性等特征改變了傳統供應系統的結構[2].在供應商全鏈路系統的管理維護中,動態特征提取是非常重要的一項內容.供應商全鏈路運行過程中會表現出相對應的動態特征,其所收集到的數據是冗雜的,且在眾多動態特征中摻雜著某些與問題關系不明顯或無關的數據.因此,若要發現某一問題,就要找到與之對應的動態特征.動態特征提取就是將多特征數據轉換成僅包含主特征的數據,再對降維后的數據實施分類處理,從而實現對原數據的準確分類識別.