李月明,鄭貴省,車亞輝,王 元,王 鵬
(1.軍事交通學院 研究生管理大隊,天津300161; 2.軍事交通學院 基礎部,天津 300161)
?
● 基礎科學與技術Basic Science & Technology
區域路網路面性能的模糊聚類分析
李月明1,鄭貴省2,車亞輝1,王元1,王鵬1
(1.軍事交通學院 研究生管理大隊,天津300161; 2.軍事交通學院 基礎部,天津 300161)
為劃分路面性能等級和顯示路網路面性能水平分布狀況,考慮路網路面性能的模糊性,采用模糊聚類相關理論的應用方法,通過路網內不同段落路面性能各項測試參數的模糊C均值聚類分析,對不同道路的路面性能參數進行分類。通過聚類結果比較分析,直觀地體現了路網內不同段落路面性能的狀況分類情況。并以2007年浦東新區某公路路網路面使用性能檢測數據進行計算,驗證了該方法的有效性。
路網;路面性能;模糊聚類;分類分析
公路網是交通運輸系統中最為基本和普遍的運輸網絡,它的基本性能直接決定了運輸能力的強弱,因此,研究路網中路段路面性能是評價路網運輸能力的重要方式。目前,有關路網路面性能參數評估的方法主要是通過相關的路面性能評價機制對各路段進行測評,然后依據評估標準對測評結果進行化類分析,確定公路網中不同等級公路的比例及分布等[1]。有關路面性能評價一般采用路網養護相關技術規范中分項和綜合評價指標評價方法[1],這是一種對路面性能參數等級分類定性的“硬化分”,這種方法評測出的路面性能結果具有“很強的確定性”。實際上,路面質量和損壞狀況的評價以及各項使用性能參數的評級標準會有一定主觀色彩,對路面性能狀況的等級評估結果并不是確定的,對等級的劃分界線也沒有明確的概念[2],因此,路面性能等級的評估界線上具有模糊特性。同時,在所處環境因素及本身結構性能的復雜影響下,路面性能狀況具有不確定性[3]。因此,應用模糊聚類分析路網路段的性能參數狀況是非常有研究意義的。利用模糊聚類分析的方法,使用Matlab軟件對相關路面性能進行聚類,將路網內不同路段路面性能狀況相似度較大的聚為了一類,從而使路面性能不同的路段被區分出來,達到劃分路面性能等級和顯示路網路面性能水平分布狀況的研究目的。
聚類就是依據事物某些屬性,將具有較大相似性的事物歸為一類,使類間事物屬性相似程度達到最大,類間相似程度最小[4]。經典數學理論中的聚類方法是依據某種標準將待聚對象嚴格劃分為一類。但是在人類社會和各科學領域中,人們所遇到的量除了具有確定性之外還有不確定性,不確定性又包含隨機性和模糊性[5]。模糊數學的思想最早是在1965年由美國加利福尼亞大學的扎德教授在《模糊集合》這篇論文中提出的[5],之后模糊思想不斷發展,Dunn在1973年提出了模糊C均值聚類算法,Bezdek J C在1981年對這一算法進行完善并應用到實際中[6]。目前,聚類的方法主要有層次聚類法、劃分聚類法及基于網絡和密度的聚類算法3類。本文采用劃分聚類法,這種方法需預先指定聚類數目或聚類中心,經過不斷迭代逐步降低目標函數的誤差值,使目標值達到一致收斂,聚類結束,如K均值(C均值)聚類算法[4]。本文介紹的模糊C均值聚類算法就是基于此種算法并結合模糊理論改進的適合用于類屬模糊的聚類算法。
1.1基于模糊等價矩陣模糊聚類的一般步驟
(1)數據標準化。討論被分類對象的全體U={x1,x2,…,xn},通過m個指標對其中的每個對象特征進行表示,xi={xi1,xi2,…,xim},i=1,2,…,n。得到原始數據的矩陣X為
(1)
對模糊矩陣進行數據標準化,以便能夠使其滿足數據在[0,1]上的要求。在此處選用平移——標準差處理樣本數據。

(2)

再對數據進行歸一化處理:
(3)
式中x'lmax、x'lmin分別為x'il中最大值和最小值。
(2)建立模糊相似關系。相似關系通過建立在U上的相似矩陣R表示,而R的計算方法一般選用相似系數法、數量級法、最大最小法、算數平均法、集合平均方法、絕對值指數法及絕對值減數法[4]。
(3)建立等價關系。等價關系不僅包括反射性和對稱性,而且要滿足傳遞性。上文建立的R是相似矩陣,一般只具備前兩個性質,而不具有傳遞性,所以要通過一些改造使其具有等價關系。一般通過平方法求R傳遞閉包R*:先使R自乘改造為R2,再自乘得R4,如此繼續下去,直到R2k=Rk=R*的時候停止。此時R*滿足傳遞性,于是模糊相似矩陣R就被改造成一個模糊等價關系矩陣R*。

1.2模糊C均值聚類(FCM)算法的實現
模糊C均值聚類(FCM)算法和普通C均值聚類算法不同的是增加特征函數uj(xi)為第i個樣本對于第j類隸屬程度。
本文是基于目標函數的聚類算法,使得目標函數達到最小。FCM把n個樣本xi{i=1,2,…,n}分為c個模糊類別,并計算每個類的聚類中心,使得目標函數達到最小。xi{i=1,2,…,n}是n個樣本對象組成的對象全體,c是根據需要提前設定的類別數目,mj(j=1,2,…,c)則為聚類中心。
設目標函數為

(4)
式中b是一個常數,與聚類結果的模糊程度有關,b值越大,分類越模糊,通常設置b大于1,但一般不超過2,以免結果不具真實性。其中:
(5)
在式(2)下求式(1)的極小值,令Jf對mj和uj(xi)的偏導數為0,可得必要條件為
(6)
(7)
FCM迭代過程如下:① 設定初始聚類數目c及參數b,目標函數迭代精度ε;② 初始化各個聚類中心mj(j=1,2,…,c);③ 根據式(7)計算隸屬函數矩陣;④ 根據式(4)計算目標函數,Jf<ε,則算法停止,否則,返回步驟③。
2.1路網路面性能評價指標及實例數據
路面性能評價就是對相關的各項指標進行定量、定性分析,揭示現有公路網存在的問題,為規劃近、遠期公路網服務。評價的首要工作是選擇評價指標,指標選擇和指標量化的合理性、全面性以及科學性直接決定評價結果的準確與否。經過分析比較,選取的指標主要有:路面強度系數(SSI)、路面狀況指數(PCI)、行駛質量指數(RQI)、橫向力系數(SFC) 。以2007年浦東新區某公路路網路面使用性能檢測數據為例進行計算(見表1)。
2.2數據預處理
根據模糊聚類的要求,為消除不同量綱對數據的影響,必須對樣本進行數據預處理[5]。采用上面提到的平移——標準差方法,依照式(2)、(3)處理樣本數據,使用Matlab編程歸一化處理后的數據矩陣為

表1 浦東新區某公路路網路面使用性能檢測數據

2.3模糊C均值聚類
根據上述標準化的數據矩陣,對各線路進行模糊C均值聚類,結合實際研究需要和模糊C均值聚類算法的要求,設定初始聚類中心數目為3,隸屬度矩陣的指數為2,隸屬度最小變化量為10-5,運算結果如下。
聚類中心:

隸屬度矩陣:

上面的聚類中心矩陣C是一個3×4的矩陣,每一行是一個類的中心坐標。隸屬度矩陣U是3×15的矩陣,每一列是一個路線屬于3個類的隸屬度。比如第一列元素有0.901 1、0.063 8、0.035 0,代表路線S1屬于第一類的隸屬度是0.901 1,屬于第二類的隸屬度是0.063 8,屬于第三類的隸屬度是0.035 0,顯然第一類的隸屬度最大,所以可以把路線S1歸為第一類,其他路線的分類與此相似。
從上面的隸屬度矩陣中查找每一列的最大值的行標就能夠確定每條路線的所屬類別,這樣能很清楚地知道每條路線的分類類屬:
Ⅰ類:{ S1,S2,S3,S4,S12,S13};
Ⅱ類:{ S7,S8,S9,S10,S11,S14,S15};
Ⅲ類:{ S5,S6}。
本文以2007年浦東新區某公路路網路面使用性能檢測數據為例,結合模糊C均值聚類的方法對其進行聚類分析,解決路網路面性能狀況分類評價的模糊性和不確定性,使劃分不再是“硬化分”,可以根據實際情況和需求進行劃分,從而使評價結果更加符合客觀性和全面合理性。通過實例分析可知,將模糊聚類分析的方法應用在路網路面性能評估上是可行的。將分類結果的差異與按照規范規定的處于同一性能水平內的各路段路面的狀態參數進行對比,使在對路面進行維護保養時的優先順序能夠更加合理。
[1]交通部公路科學研究院,上海市公路管理處.公路技術狀況評定標準:JTG H20—2007[S].北京:人民交通出版社,2007.
[2]沈海生.瀝青路面性能非線性模糊評價及預防性狀護最佳時機研究[D].合肥:安徽建筑大學,2015.
[3]張麗娟,凌建明,祝云琪.基于灰色模糊聚類法的路網路面使用性能評價[J].同濟大學學報(自然科學版),2010,38(2):525-256.
[4]楊綸標,高英儀,凌衛新.模糊數學原理及應用[M].5版.廣州:華南理工大學出版社,2011:79.
[5]謝季堅,劉承平.模糊數學方法及其應用[M].4版.武漢:華中科技出版社,2014:2.
[6]賈繼德,孔凡讓.發動機連桿軸承故障噪聲診斷研究[J].農業機械學報,2005,36(6):89 -90.
(編輯:史海英)
Fuzzy Cluster Analysis on Road Performance of Regional Road Network
LI Yueming1, ZHENG Guixing2, CHE Yahui1, WANG Yuan1, WANG Peng1
(1.Postgraduate Training Brigade, Military Transportation University, Tianjin 300161, China;2.General Courses Department, Military Transportation University, Tianjin 300161, China)
To obtain the performance levels of the roads and their horizontal distribution in road network, this paper classified the performance parameters of different roads. During the process, the fuzziness of the performance is considered, FUZZ Clustering theory is applied and all the test parameters of the road performance in different sections are analyzed through fuzz C-means clustering. The road performance of different sections is reflected directly. The validity of this method is verified by the test data of the road network in Pudong New Area in 2007.
road network; road performance; Fuzzy Cluster; classification analysis
2015-10-10;
2016-04-25.
李月明(1990—),男,碩士研究生.
鄭貴省(1975—),男,博士,副教授,碩士研究生導師.
10.16807/j.cnki.12-1372/e.2016.07.020
U491.1
A
1674-2192(2016)07- 0087- 04