李永華,李金穎
(1.大連交通大學交通運輸工程學院,遼寧大連116028;2.大連交通大學機械工程學院,遼寧大連116028)
目前國內外評價方案優劣的方法主要有主成分分析法、灰色關聯法、層次分析法、模糊集理論、熵權法、TOPSIS方法、神經網絡和支持向量機等方法。其中TOPSIS(Technique for Order Preference by Similarity to Ideal Solution)是一種適用于有多個目標屬性的多個方案進行比較選擇的分析方法,對原始數據矩陣進行歸一化處理后,找出有限方案中的理想解和負理想解,分別計算各個待評價對象到正理想解和負理想解的距離,獲得各個評價對象與正理想解之間的貼近度[1]。但是,由于傳統的TOPSIS方法存在以下缺點:1)對原始數據矩陣的計算比較復雜;2)屬性權重是事先確定的,存在一定的主觀性[2]。因此針對傳統的TOPSIS方法,本文采用基于傳統TOPSIS的支持向量機方法對某鐵路重載貨車設計方案進行評價,一方面由于支持向量機的機器學習的特性,克服了TOPSIS方法在確定屬性權重時的主觀性。另一方面由于支持向量機和Matlab軟件可以很好的結合,使復雜的矩陣計算也變得容易。
TOPSIS方法的基本思想是對歸一化后的原始數據矩陣確定出理想中的最佳方案和最差方案,求出各個備選方案與最佳方案和最差方案之間的距離,得出每個方案與最佳方案的接近程度,并以此作為評價各個備選方案優劣的依據[3-4]。
對于多個目標屬性的有限個方案,其TOPSIS方法的求解步驟如下[5]:
1)設有m個備選方案,每個備選方案有n個屬性,其中第i個備選方案的第j個屬性值為xij,則原始數據矩陣V為

2)由于各個屬性的量綱可能不同,需要對初始數據矩陣進行歸一化處理,則歸一化處理后的矩陣 V′為

3)根據歸一化后的矩陣,確定正理想解和負理想解
正理想解為m個備選方案中的n個屬性中,均達到最優值的理想方案,即為正理想解。同理,負理想解即為m個備選方案中的n個屬性均達到最劣值的方案,即:

4)計算各個備選方案的目標屬性值到正理想解和負理想解的距離

5)計算各個目標的貼近度

6)最后根據貼近度大小對方案進行排序。
支持向量機(Support Vector Machine,SVM)是Vapnik和Cortes等于1995年根據統計學習理論中結構風險最小化原則最早提出的一種新的機器學習方法[6]。它在解決小樣本、非線性及多維問題中表現出許多特有的優勢,與傳統的人工神經網絡相比,SVM具有結構簡單、理論完備、適應性強、全局優化、泛化性能好等優點[7]。
目前,SVM算法在分類、回歸預測等方面都有應用,并且憑借其諸多優點在人工智能和機器學習領域頗受關注。本文在TOPSIS方法的基礎上,使用支持向量機方法對各個備選方案進行回歸預測,從而選出較優的方案。
現有機器學習方法共同的重要理論基礎之一是統計學習理論[8-9]。傳統統計學研究需要大量的樣本數據支持,因此統計學習理論與傳統的統計學相比,它是一種專門針對樣本數量很少的機器學習理論。與傳統統計學相比,它基本上不涉及概率論相關的定義及大數定律,它為建立有限樣本學習問題提供了一個統一的框架,它有效地避免了人工神經網絡等方法的網絡結構選擇、過學習和欠學習問題以及局部最小等問題。
SVM是專門針對有限樣本情況的學習機器,實現的是結構風險最小化[10]。SVM將實際問題通過非線性變換轉換到高維的特征空間,在高維空間中設計線性學習方法,即利用核函數替換線性算法中的內積,得到原輸入空間中對應的非線性算法,解決了維數問題,保證了較好的推廣能力,而且算法復雜度與樣本維數無關。
本文中SVM回歸預測是通過Matlab軟件中的Libsvm工具箱進行回歸預測。首先輸入數據作為訓練集,將TOPSIS貼近度函數作為目標函數;然后利用支持向量機理論知識選取回歸模型中的參數和核函數;再通過交叉驗證方法選取均方根誤差較小的參數;最后輸入測試數據作為測試集,建立測試目標函數,預測輸出。
鐵路貨車是鐵路貨物運輸的重要裝備,在國民經濟發展中起著重要的作用。因此,對鐵路貨車的的載重、運行速度等性能的要求也越來越高。因此,一個最佳的設計方案就顯得尤為重要。本文將TOPSIS和SVM相結合,借助于Matlab軟件對某鐵路重載貨車的設計方案進行評價,選出最優方案。
某鐵路貨車生產企業在進行新型鐵路重載貨車的設計研發過程中,給出8種設計方案,如表1所示。

表1 鐵路重載貨車初步設計方案Table 1 The preliminary design schemes of the railway overloaded trucks
首先,利用Matlab軟件及上述歸一化公式對上表進行歸一化處理,其結果如表2所示。

表2 進行歸一化處理后的備選方案Table 2 The schemes after normalization process
由于鐵路貨車的不斷發展,所以人們希望在盡可能降低自重和軸重情況下提高載重和容積。由于鐵路運輸量的不斷增加,較高的運行速度是提高貨運效率的一種重要手段。因此,在保證安全性要求的前提下盡量提高鐵路貨車的運行速度。制動距離越小,說明其制動性能越好,也會大大地提高其安全性。因此,由公式(3)、(4)可以得到最優方案和最劣方案,即理想解與負理想解。

根據已經求得的正理想解和負理想解,利用Matlab軟件及公式(5)和(6)可求得各個備選方案的目標屬性值到正理想解和負理想解的距離和。將其代入到公式(7)即可得到貼近度,從而選出最優方案。但是由于在最優方案和最劣方案的選取時存在一定的人為因素,因此將貼近度公式作為目標函數,通過支持向量機這一機器學習的方法來克服其主觀性,從而獲得一個較為客觀的評價結果。
針對某鐵路重載貨車,使用基于TOPSIS的支持向量機法對其進行預測。本文選取的支持向量機類型為 ε-SVR,核函數為 RBF核函數,使用Matlab軟件中的Libsvm工具箱,進行回歸預測。每次預測過程選取6個設計方案作為訓練集,其余兩個方案作為測試集。下面以方案7和8為測試集,其余方案為訓練集,采用交叉驗證進行參數優化[11],在參數粗略選擇時,設其懲罰參數C的對數log2c的取值范圍為(-10,10),參數 g的對數log2g的取值范圍為(-10,10),每次優化的步長取為0.5,在參數精細選擇時,設其懲罰參數C的對數log2c的取值范圍為(-5,5),參數g的對數log2g的取值范圍為(-5,5),每次優化的步長取為 0.1。

圖1 參數粗略選擇結果圖Fig.1 Parameters of rough selection

圖2 參數精細選擇結果圖Fig.2 Parameters of fine selection
由圖1~圖2可知,經過交叉驗證,粗略選擇結果為均方根誤差CVmse=0.011 468,懲罰參數C=32,參數 g=1,精細選擇結果為均方根誤差CVmse=0.010 969,懲罰參數 C=18,參數 g=1.3。依照上述方法,其余6個設計方案的測試結果均可獲得,其結果如表3所示。

表3 測試結果表Table 3 Test results
由表3可知,最優方案為方案6,即方案6中其自重和軸重都比較低,雖制動距離較長,但載重、容積和運行速度較大。最劣方案為方案2,其中雖載重很大,但其軸重和自重都很大,相比較其他方案其運行速度不高,制動效果也不好。
1)通過對某鐵路重載貨車的8個設計方案的評價,可以看出方案6的貼近度值最大,說明該方案設計最接近理想方案。綜合比較測試結果,可以發現對于每個方案的6個目標屬性,其容積、載重和最高運行速度的大小對方案優劣具有較大的影響,而自重、軸重和制動距離產生的影響則相對較小。
2)TOPSIS方法與支持向量機方法單獨使用都可以進行方案評價。傳統TOPSIS方法對原始數據矩陣計算較復雜,并且屬性權重是事先確定的,存在一定的主觀性,單獨使用支持向量機時,需要對方案建立目標函數關系。因此將二者結合具有以下優點:借助支持向量機方法的機器學習特性克服主觀性;將TOPSIS方法的貼近度函數作為目標函數進行預測。此外,借助Matlab分析計算軟件以解決數據矩陣的復雜計算。
[1]梁昌勇,戚筱雯,丁勇,等.一種基于TOPSIS的混合型多屬性群決策方法[J].中國管理科學,2012,20(4):109-116.
LIANG Changyong,QI Xiaowen,DING Yong,et al.A hybrid multi-criteria group decision making with TOPSIS method[J].Chinese Journal of Management Science,2012,20(4):109 -116.
[2]張亞東,鄒波,郭進,等.基于TOPSIS法的列車運行控制系統風險排序模型的研究[J].中國鐵道科學,2012,33(6):96-101.
ZHANG Yadong,ZOU Bo,GUO Jin,et al.Study on the risk ranking model of train control system based on TOPSIS method[J].China Railway Science,2012,33(6):96-101.
[3]Goyal,Kapil Kumar,Jain,P K,et al.Optimal configuration selection for reconfigurable manufacturing system using NSGA II and TOPSIS[J].International Journal of Production Research,2012,50(15):175 -191.
[4]程錦,譚建榮,余加紅.基于TOPSIS的注塑工藝參數多目標穩健優化設計[J].機械工程學報,2011,47(6):27-32.
CHENG Jin,TAN Jianrong,YU Jiahong.Multi- objective robust optimization of injection molding process parameters based on TOPSIS[J].Chinese Journal of Mechanical Engineering,2011,47(6):27 -32.
[5]Nakhaeinejad,Mahdi,Nahavandi,Nasim.An interactive algorithm for multi-objective flow shop scheduling with fuzzy processing time through resolution method and TOPSIS[J].International Journal of Advanced Manufacturing Technology,2013,66(5):47 -64.
[6]韓彥彬,白廣憂,李曉穎,等.基于支持向量機柔性機構動態可靠性分析[J].機械工程學報,2014,50(11):86-92.
HAN Yanbin,BAI Guangyou,LI Xiaoying,et al.Dynamic reliability analysis of flexible mechanism based on support vector machine[J].Chinese Journal of Mechanical Engineering,2014,50(11):86 -92.
[7]孟洛明,朱杰輝,楊楊,等.支持向量機回歸預測在網絡故障檢測中的應用[J].北京郵電大學學報,2014,37:23-29.
MENG Luoming,ZHU Jiehui,YANG Yang,et al.A fault detection algorithm for wireless sensor networks based on support vector regression[J].Journal of Beijing University of Posts and Telecommunications,2014,37:23 -29.
[8]Lee Yuh-Jye.Reduced support vector machines:A statistical theory[J].IEEE Transactions on Neural Networks,2007,18(1):1 -13.
[9]張鈴,錢付蘭,何富貴.粒計算與統計學習理論[J].計算機科學與探索,2013,7(8):754 -759.
ZHANG Ling,QIAN Fulan,HE Fugui.Granular computing and statistical learning[J].Journal of Frontiers of Computer Science and Technology,2013,7(8):1 -13.
[10]Monnet J M.Support vector machines regression for estimation of forest parameters from airborne laser scanning data[J].IEEE International Geo-science and Remote Sensing Symposium,2010:2711-2714.
[11]鄧蕊,馬永軍,劉堯猛.基于改進交叉驗證算法的支持向量機多類識別[J].天津科技大學學報,2007,22(2):58-61.
DENG Rui,MA Yongjun,LIU Yaomeng.Support vector machine multi-class classification based on an improved cross validation algorithm[J].Journal of Tianjin University of Science & Technology,2007,22(2):58 -61.