馬青云,劉海鷗,劉 鑫
(1. 廣州軟件學院電子系,廣東 廣州 510900;2. 廣州軟件學院計算機系,廣東 廣州 510900;3. 中南大學計算機學院,湖南 長沙 410000)
快遞運輸具有較大的安全風險[1],主要分為兩方面,其一是運輸品為危險品,遭受撞擊很容易引發腐蝕或者爆炸。購買小批量危險化學品,在和其它正常用品運輸的過程中,會導致運輸爆炸風險增加。我國現行危險品運輸狀況比較雜亂[2],存在較多的安全問題,引起該風險因素不是單一的,而且具有多面性,一種是由于大量化學品年運輸數量和運輸單位的資質不完整,另一種是沒有運輸資質,卻妄想私運物品,所以造成危險。其二是環境對運輸載體的影響,例如在運輸過程中,雨雪天氣會導致路面摩擦力發生變化,車輛行駛容易出現打滑側翻的狀況;還有駕駛員休息不夠、注意力不集中,車輛自身產生故障,失去控制能力等各種現象,均會對快遞運輸增添風險。
為進一步分析快遞運輸過程中的風險,確保快遞送達時間,奇格奇等人[3]提出基于語義挖掘的快遞運輸貨品風險評價方法,通過網絡大數據資源結合模糊聚類方法,實現對快遞貨品語義風險的劃分。王馨梓等人[4]提出危險貨物運輸風險分級指標評價體系,通過構建風險評價指標體系,對危險貨物運輸風險分級劃分,并提出對應管控策略。以上兩種方法均能實現對運輸風險的劃分,但劃分精準度不穩定。
在以上已有方法的基礎上,為降低貨物損失率,提高快遞運輸安全性,本研究提出了基于強化粗糙集屬性的快遞運輸風險挖掘方法。通過對快遞運輸突發事件數據預處理,將相關風險數據保存在數據庫中,構建快遞運輸風險挖掘模型,找出快遞運輸風險的規律,利用強化粗糙集方法研究某地區時間范圍內,快遞運輸條件屬性決策屬性間的依賴關系,挖掘快遞運輸風險。
在快遞運輸過程中會出現突發事件,將相關風險數據儲存在數據庫內,保存為歷史信息給評估風險奠定基礎。通過突發事件數據庫獲得歷史數據,但存在信息不完整、被噪聲與冗余干擾等問題,不適合直接作為風險挖掘計算基礎,為此使用粗糙集屬性約簡[5,6],能保證基礎信息存在外,剔除多余重復的屬性,對信息精簡提取。構建相似度矩陣來約簡噪聲和冗余數據。其度量方法表述為:


(1)

ηp=(ηp1,…,ηp(p-1),0,ηp(p+1),…,ηpn)
(2)
其中n=|U|,N表示矩陣迭代周期,那么相似度矩陣表達式為
N=(η1,η2,…,ηn)N
(3)
設1/|A|是對象相似度最小值,若xp和剩下任何對象的相似性較小,那么?i∈{1,2,…,n},其中i≠p,均有ηpi<1/|A|時,判斷xp是噪聲數據[7,8];假設xp和另外對象在全部屬性上都實現相似關聯性,便有
ηpi>|Pi|·1/(3|A|)+(|A|-|Pi|)·1/|A|
=1-2|Pi|/(3|A|)
(4)
假設?i∈{1,2,…,n}且i≠p,令ηpi>1-2|Pi|/(3|A|)時,斷定xp和xi都表示為冗余數據,把xp和xi內標記*過多數據剔除,能夠增加內存[9]。為此獲得判斷區間范圍(1/|A|,1-2|Pi|/(3|A|)),以此來約簡噪聲和冗余數據。
僅考慮國內的道路快遞運輸方式,按照全面性[10,11]、代表性與科學性原則,并借鑒其它行業運輸風險評價因素,構建針對快遞運輸風險挖掘模型。其中,條件屬性為a為技術指標,b為質量指標,c為環境指標,d為主體指標,e為裝載規范指標,決策屬性為f為事故類型;10個對象分別為10輛快遞運輸車。快遞運輸風險挖掘模型,如表1所示。

表1 快遞運輸風險挖掘模型
通過表1能夠看出,同一對象會被不同占比的多種條件和決策屬性定義,這是因為快遞運輸風險事件的產生和多種屬性間都存在關系,例如路面情況、車輛本身質量、外界環境干擾以及駕駛員狀態[12,13]。其中路面情況主要是指為城市還是農村道路、有沒有隔離帶、是否限制車輛行駛速度、照明情況、交叉路口設計等;外界環境干擾包括運輸時天氣是否良好,是否會有雨、雪、結冰以及霧等;駕駛員狀態包括司機的身心健康水平、飲酒吸煙習慣、駕駛員是否經過培訓上崗等[14]。這些因素需要根據約簡后歷史數據劃分出當前快遞運輸事件影響的主次因素,即強化粗糙集屬性,便于發現造成風險的因素與風險間的“原因-結果”關系,找出快遞運輸風險的規律[15]。
表1中數據完成了離散化處理,描述為:屬性a取1表示司機駕駛經驗豐富、未飲酒、身體健康,取2表示駕駛員經驗不足,取3表示不具備駕駛資格;屬性b為1表示車輛結構完好、車輛容器完整,為2表示汽車結構具有缺陷;屬性c為1表示干燥的路面,為2表示路面存在潮濕、泥濘、結冰或下雪等情況,為3表示有霧的天氣;屬性d為1表示車輛速度符合規定,為2表示超過規定速度;屬性e為1表示物品裝載的合理,為2表示裝載不合理、超載、或不按照標準混裝;屬性f為1表示未發生交通事故,但快遞貨物出現泄露丟失,為2表示偏出路面導致快遞貨物泄露丟失,為3表示翻車引起快遞丟失,為4表示車輛碰撞導致快遞遺失,為5表示車輛翻車碰撞引起的火災甚至爆炸。
計算屬性的重要度為
U/C={{1},{2},{3},{4,6},{5,7,10},{8},{9}}
(5)
U/D={{1,2,4,5,7},{3,8,9},{6},{10}}
(6)
U/C-{a}={{1,3},{2},{4,5,6},{7,10},{8},{9}}
(7)
U/C-{b}={{1},{2},{3},{4,6},{5,7,10},{8},{9}}
(8)
U/C-{c}={{1},{2,4,6,10},{3},{5,7},{8},{9}}
(9)
U/C-g0gggggg={{1},{2,4,7},{3},{5,7,10},{8},{9}}
(10)
U/C-{e}={{1},{2,4,7},{3},{5,7,10},{8},{9}}
(11)
其中
POSC(D)={1,2,3,8,9},POSC-{a}(D)={2,8,9},POSC-{b}(D)={1,2,3,8,9},POSC-{c}(D)={1,3,8,9},POSC-g0gggggg(D)={1,3,8,9},POSC-{e}(D)={1,3,8,9},按照γC(D)=card(POSC(D))/card(U)與SGF(a)=γC(D)-γC-{a}(D),能夠得出:SGF(a)=0.25,SGF(b)=0.15,SGF(c)=0.15,SGF(d)=0,SGF(e)=0,再實行歸一化整理,得到:SGF(a)=0.6,SGF(b)=0.2,SGF(c)=0.2,SGF(d)=0,SGF(e)=0。
上述,card表示為基數,POS(·)表示屬性對應的粗糙集正域,C表示條件屬性集,D表示決策屬性集,γC(D)表示兩者之間的依賴程度,SGF(·)表示屬性在風險挖掘中的重要程度,表γC-{a}(D)示條件屬性集C內剔除屬性a之后的屬性依賴程度。
強化粗糙集屬性重要度,描述的是條件屬性對決策屬性的影響程度與重要程度,也可以說決策屬性對條件屬性的依賴程度。通過強化粗糙集方法研究某地區時間范圍內快遞運輸條件屬性決策屬性與決策屬性的依賴關系,觀察到此范圍內快遞運輸事件的出現,挖掘得出最關鍵的因素是屬性a,即為技術指標情況,其次是屬性b與c,即質量與環境指標,屬性d與屬性e,即主體指標和裝載規范指標。基于此,利用重要度屬性,得到數據不同的風險情況,精準挖掘出風險可能性。這對于快遞運輸風險分類有著重要作用,有助于更好的做出保護措施,完善運輸技術,確保運輸安全。
實驗選擇上海-杭州快遞運輸路線,如圖1所示。運輸過程中具體的實驗參數如表2所示。

圖1 上海-杭州快遞運輸路線圖

表2 實驗參數
由于快遞不僅僅要滿足上海-杭州,還要保證快遞公司利潤最大,因此會出現6種完全不同線路,在途中還會配送上海-杭州線路涉及的相關城市。6條快遞線路中,路線1#道路情況較差。路線2#、路線3#會涉及邊緣城市和鄉村,路面主要是水泥窄路或者國道。路線4#最短,平穩度也較高,5#和6#偏向沿海城市。
路線1#途徑地區較多,會經過郊區窄小路面,道路情況較為差。圖2得知車輛A1風險可能性較高,危險程度相對增加,因為車輛速度較快,若是在交叉路口突然出現車輛,會來不及反應,導致事故發生;A3風險可能性極高,危險程度極高,說明駕駛人員身體疲勞,容易出現事故。
由于路線2#經過的區域多,配送地點多,路程最遠,駕駛員會出現過度勞累。圖3得知,A2的風險可能性雖高,但是危險程度較低;其余類型風險可能性都較高,危險程度升高,在天氣和路面不好的情況下,貨物泄露為其它車輛增添危險,由此說明整體風險很高,需格外關注。

圖2 路線1#的風險挖掘結果
路線3#行駛彎道較多,易在轉彎時發生危險。圖4所示,可以看出路線3#的A1風險可能性較低,A3較高,說明車輛行駛速度較低,但是駕駛員身體疲勞程度較高,容易行駛中發生瞌睡,在突發情況中應急水平較差,容易造成事故;A4與A5的可能性高,證明路面狀況不好,行駛存在困難,天氣情況較差,視線受到影響,危險程度增加。

圖3 路線2#的風險挖掘結果
由于路線4#路程最短,較為平緩,途經地區較少,能夠保證駕駛人員不會長時間行駛。通過圖5中得知,路線4#的車輛A2風險可能性較高,危險程度不高,是由于此風險是運輸車輛存在泄露,只是貨物丟失概率增加,但車輛與駕駛人員不具有危險性;其它風險可能性均較低,說明運行速度合適、駕駛人員休息得當、道路狀況良好、天氣晴朗,各方面都很好,由此說明路線2#的快遞運輸風險僅僅存在快遞丟失的狀況,發生事故的危險程度極低。

圖4 路線3#的風險挖掘結果
由于路線5#靠近沿海位置,天氣容易突變,產生雨霧;路面濕滑,在車輛行駛時需要注意車速。由圖6可知,路線5#車輛駕駛員經驗豐富精神狀態較好,在運輸過程中,天氣突然發生變化,路面出現濕滑,為了可以及時配送,速度增加,因此危險程度增加;車輛貨箱發生泄露,天氣環境不好,危險程度水平提高。后續需要對駕駛人員培訓,增強安全意識。

圖5 路線4#的風險挖掘結果
路線6#更加偏向沿海城市,天氣與道路情況可知,車輛速度與貨箱密封性較好,危險程度不高;路面情況較差,是由于前兩天的雨雪導致道路結冰,所以危險程度較高;駕駛員疲勞,在面對緊急狀況時,容易失去反應能力,發生碰撞或翻車。

圖6 路線5#的風險挖掘結果

圖7 路線6#的風險挖掘結果
快遞運輸種類較多,例如汽車陸運、船只海運以及貨機空運,因此在運輸中的突發事件風險因素也較多。為減少危險事件產生概率,提出基于強化粗糙集屬性的快遞運輸風險挖掘方法。通過分析歷史記錄信息,去除干擾數據,構建風險挖掘模型以便更好分析快遞運輸事件因素,并憑借強化粗糙集屬性突出重要影響因素,實現精準和全面的挖掘。