王洋
(楊凌職業技術學院 經濟與貿易分院, 陜西 楊凌 712100)
大數據分析技術是隨著網絡不斷發展而誕生,大數據分析技術是指分析大規模的數據,大數據主要包括速度快、多類型、真實性、大量數據和高價值5個特征。隨著大數據技術不斷發展,數據挖掘、數據安全和數據分析等眾多技術已成為眾多研究學者研究熱點[1],大數據分析技術是大數據時代的主要技術。
電子商務近年來發展極為迅速,電子商務快速發展推動物流行業進步,目前電商交易已成為人們生活主要方式,物流系統各項數據隨著電子商務發展而直線增長。將大數據分析技術應用于物流行業已成為物流行業的發展趨勢[2],尤其是隨著國家政策放寬,跨境電商高速發展,使大數據分析技術成為物流行業變革主要方式,眾多物流企業利用大數據分析技術提升物流行業服務水平[3]。物流行業的DHL國際快遞公司已經利用大數據分析技術較快效率為客戶物流數據實現高質量服務。UPS國際快遞公司利用大數據分析技術選取最優配送策略,有效節省物流配送成本。電子商務不斷發展使物流信息步入大數據時代,大數據分析技術對電商企業高速發展具有極高應用價值[4-6],大數據分析技術可深度挖掘物流信息中包含的有用信息,為跨境電商物流風險評估提供基礎。
為了提高跨境電商的物流風險評估準確性,提出了大數據分析技術的跨境電商物流風險評估,利用大數據分析技術實現跨境電商智能物流建設,為推動跨界電商物流行業發展提供理論基礎。
考慮跨境電商物流大數據具有特殊性與信息敏感性,為便于跨境電商物流風險評估[7],研究物流大數據分析平臺,平臺總體結構圖如圖1所示。

圖1 跨境電商物流大數據分析平臺
通過圖1可實現跨境電商物流大數據高效分析。物流大數據分析平臺充分考慮物流大數據存儲與處理,具體包括大數據調度、訪問、數據倉庫、備份、數據管理以及數據恢復等眾多功能。分析平臺各部分功能如下。
(1) 利用虛擬機、服務器以及操作系統構建,選取通用虛擬機、服務器以及操作系統即可構建平臺,降低平臺搭建成本,提升平臺擴展性能。
(2) 利用Hadoop架構實現跨境電商物流大數據存儲框架,選取分布式文件處理技術實現ZB、PB等不同級別跨境電商物流大數據的清洗、搜集以及存儲等功能[8]。
(3) 利用分布式計算技術實現跨境電商物流大數據分析平臺內數據計算,分布式計算利用閑置計算機處理與運算多類型、海量數據,將復雜運算簡單化,綜合閑置計算機的計算結果獲取所需計算結果[9],符合大數據計算需求,將數據交換、協同工作與資源共享相結合,實現大數據計算處理。
(4) 物流大數據集成管理技術將各種系統中差異格式、性質、特點的數據集合,利用清洗算法過濾數據集合中無效、錯誤和冗余數據,使最終集成數據集合具有真實性與穩定性[10]。物流平臺中的物流大數據集成管理技術包括數據庫技術、數據融合技術、數據抽取以及清洗等技術。
(5) 網絡層實現物流大數據的訪問,由Pig、Sqoop和Hive模塊共同組成物流大數據訪問框架,利用該框架實現物流數據訪問,其中包括存儲系統以及數據倉庫中物流數據訪問。
(6) 利用虛擬存儲設備將各個物理位置存儲設備集合的技術,依據系統需求以及不同位置存儲資源將物流數據存儲至最佳位置,提升大數據分析平臺存取效率、可用性以及擴展性[11]。采用HDFS系統作為分布式存儲系統,該系統利用DAS模式存儲普通物流數據,Hadoop計算獲取的重要數據、文件和分析結果等利用SAN和NAS模式存儲。
(7) 采用Flume、Hbase、Avro、ZooKeeper等模塊組成物流大數據調度框架,通過該框架實現物流大數據的調度與組織。
(8) 物流企業與該平臺通過應用接口連接,利用物流企業應用框架實現物流大數據報表生成以及信息統計等功能。
(9) 安全防護子系統實現物流大數據的備份、恢復,通過該子系統實現物流大數據的保護與管理。物流大數據分析平臺中包括眾多企業與用戶信息,以上信息與企業和用戶的個人隱私、經濟利益和人身安全息息相關,因此物流大數據分析平臺的安全性能具有較高需求,利用用戶隱私保護、用戶訪問控制、數據管理以及多租戶安全管理實現物流大數據安全防護。
將以上硬件與軟件結合,實現物流大數據分析,跨境電商物流大數據分析平臺運行流程為:采集物流大數據,將所采集物流大數據匯聚[12],進行清洗、存儲等步驟,選取分布式計算技術實現數據計算獲取跨境電商物流風險評估基本數據,并將數據通過文字、圖片或報表形式展示至評估者,評估者通過該平臺獲取的大數據實施物流風險評估。
1.2.1 因素確定
評估跨境電商物流風險時,需考慮與跨境電商物流有關的所有因素,與跨境電商物流有關的因素具有層次和級別等差別。模糊綜合評價法是一種基于模糊數學的綜合評價方法。采用模糊數學方法,對受多種因素制約的事物或對象進行綜合評判。該方法結果清晰,系統性強,適用于各種非確定性問題,能夠較好地解決模糊和難以量化的問題。利用模糊綜合評估法的多級別評估方法評估跨境電商物流風險。通過兩個層次因素形成評估指標集合。利用跨境電商物流風險評估體系的8個風險因素組成第一層因素[13],將以上8個風險因素設置為評估子因素集合,子因素集合如式(1)。
G={g1,g2,g3,g4,g5,g6,g7,g8}
(1)
式中,G與g1分別表示因素集以及合作競爭因素風險;g2與g3分別表示倉儲包裝因素風險以及環境因素風險;g4與g5分別表示配送因素風險以及信息因素風險;g6、g7與g8分別表示海關因素風險、裝卸運輸因素風險以及戰略文化因素風險。

1.2.2 模糊評估矩陣構建
利用單因素評判法評判8個單因素gi,選取跨境電商物流專家評估各因素下的風險因子,評估結果選取百分比方法統計[14]。各個單因素下的隸屬度矩陣通過專家在不同風險登記下對各單因素的評估比例獲取,隸屬度矩陣計算式如式(2)。
G×V→[0,1],rij=P(gi,vj)
(2)
式中,P表示評估因素模糊評估矩陣,即評估尺度集G與評估因素集V間模糊關系;rij表示評估尺度因素隸屬度。
1.2.3 單因素評估與風險綜合評估
單因素gi的綜合評估通過單因素的隸屬度矩陣Pi實現,獲取綜合評估向量Di=Qi×Pi(i=1,2,…,8),其中Pi與Qi分別表示單因素gi的1×ni階權重向量以及ni×5階的單因素評判矩陣,Di表示gi中的1×5階一級綜合評估結果矩陣。
完成全部單因素和綜合評估后,對評估對象實施跨境電商物流風險綜合評估[15]。選取Di作為元素gi的單因素評估,獲取8×5階評估矩陣如式(3)。
(3)
跨境電商物流風險一級指標g1,g2,…,g8權重Q如式(4)。
Q=(0.325,0.206,0.117,0.097,0.078,0.074,0.058,0.045)
(4)
獲取因素集G中二級評判結果如式(5)。
D=Q×P
(5)
可得全部一級指標綜合評估值Yi如式(6)。
Yi=Di×VT
(6)
目標指標綜合評估值Y如式(7)。
Y=D×VT
(7)
利用式(7)獲取大數據分析技術的跨境電商的物流風險評估結果。
為驗證本文大數據分析技術的跨境電商的物流風險評估跨境電商物流風險有效性,選取某跨境電商物流公司作為實驗研究對象,評估該跨境電商物流公司的物流風險。該公司創建于2002年,是國家一級物流運輸公司,公司主要業務為跨境電商專業國際物流服務,為大型跨境電商天貓國際、敦煌等大型跨境電商制定專業物流策劃,隨著該公司不斷發展,該公司物流業務已發展至全球180個國家與地區。
采用本文方法獲取8個一級指標以及目標指標綜合評估值和風險等級,利用以上結果評估該公司物流風險,評估結果如表1所示。

表1 本文方法評估結果
風險評估體制為5分制。通過表1評估結果可以看出,該物流公司總體風險評估值為3.545,該物流公司電商跨境物流風險等級為中等。8個風險因素一級指標綜合評估結果從高至低排列分別為倉儲包裝因素、裝卸搬運因素、配送因素、合作競爭因素、海關因素、戰略文化因素、環境因素和信息因素,它們的綜合評估結果分別為4.261、4.125、4.056、3.915、3.542、3.054、2.845、2.561,其中倉儲包裝因素、裝卸搬運因素、配送因素3個因素的風險評估結果達到了高級,說明該物流公司發生以上3種風險的概率極高;其中合作競爭因素、海關因素、戰略文化因素3個因素風險評估結果為中,說明以上3種風險因素有比較大的可能在該公司發生;環境因素、信息因素2種因素的風險評估結果為低,說明環境因素、信息因素2種因素在該公司發生的可能性較低。
該跨境物流公司總風險評估結果為3.545,風險等級為中等,說明該物流公司仍然存在一定風險,該公司需要通過有效的措施降低物流風險,對于風險因素級別較高的風險因素,應重點研究降低風險策略,提升物流公司的物流效率,通過降低該公司物流風險獲取更高收益。
通過以上實驗有效驗證本文方法評估跨境電商物流風險有效性。為進一步驗證本文方法對于大數據物流信息的評估性能,統計采用本文方法在不同數據量情況下評估精確度。為直觀展示本文性能,將本文方法與OWA方法以及MDHGF方法對比。OWA方法既適用于整體大風險的計算、比較,也適用于具體的風險因素間的比較。同時考慮到了各風險事件的不同的緊急性,具有靈活性。MDHGF集成法,是將德爾菲法(Delphi)、層次分析法(AHP)、灰色關聯(Grey)、模糊評判(Fuzzy)集合而成,采用不同的理論和方法對整個評價過程進行不同的步驟,得到最合理的評價結果。將50組訓練樣本數據在MATLAB平臺進行模擬訓練學習,檢驗樣本為20組。通過10次迭代達到設定的評估誤差,對比檢驗樣本的評估準確度。
對比結果如圖2所示。

圖2 不同方法評估精確度對比
通過圖2實驗結果可以看出,本文方法在不同數據量情況下評估精確度高于98%,而另兩種方法在不同數據量情況下評估精確度均小于98%,采用本文方法在不同數據量情況下評估精確度明顯高于OWA方法以及MDHGF方法,驗證本文方法評估性能。
統計采用本文方法在不同數據量情況下的評估靈敏度,為直觀展示本文性能,將本文方法與OWA方法以及MDHGF方法對比,對比結果如圖3所示。

圖3 不同方法評估靈敏度對比
從圖3實驗結果可以看出,采用本文方法在不同數據量情況下評估靈敏度明顯高于OWA方法以及MDHGF方法,本文方法在不同數據量情況下評估靈敏度均高于99%,實驗結果有效驗證本文方法評估性能。本文方法采用大數據分析技術,因此在大數據情況下仍具有較高的評估靈敏度。
統計采用本文方法在不同數據量情況下評估速率,為直觀展示本文性能,將本文方法與OWA方法以及MDHGF對比,對比結果如圖4所示。

圖4 不同方法評估速率對比
通過圖4實驗結果可以看出,采用本文方法在不同數據量情況下評估速率明顯高于OWA方法以及MDHGF方法,本文方法在不同數據量情況下評估速率均高于40 GB/s,且評估速率并未隨著數據量的增加而有所降低,有效驗證本文方法的評估速率。本文方法采用大數據分析技術,對于數據量較大情況下仍具有較高的評估速率。大數據分析處理技術以計算機內部數據處理系統為基礎,基于大數據物流數據平臺而設計,避免傳統計算機整體性運算,具有較高的處理速率,實現大數據評估綜合運行,提升大數據處理計算速率。
統計采用本文方法在不同數據量情況下的大數據分析平臺空間利用率,為直觀展示本文性能,將本文方法與OWA方法以及MDHGF方法對比,對比結果如表2所示。

表2 不同方法評估空間利用率對比
從表2實驗結果可以看出,采用本文方法評估跨境電商物流風險,不同數據量時評估空間利用率均明顯低于OWA方法以及MDHGF方法,本文采用大數據分析技術,大數據分析技術通過虛擬空間存儲技術,為物流風險評估提供了較大的存儲與計算空間,不僅可保證大數據處理完整性,提升系統評估速率,有效降低空間利用率。
大數據分析處理技術具有的高處理速度、高安全性能的優勢已廣泛應用于各種領域中,將大數據分析處理技術應用于跨境電商物流風險評估中,采用模糊綜合評估法利用物流大數據分析平臺中數據評估跨境電商物流風險,并選取某跨境電商物流中心作為實驗對象,采用該方法評估該公司物流風險,驗證該方法評估物流風險有效性,為跨境電商物流行業的進一步發展提供理論依據。