王夢璇 李 偉
(1.中國電子科技集團公司第二十研究所 西安 710000)(2.大連海事大學航海學院 大連 116026)
在對船舶安全航行評價中,一是要做到研究結論科學準確,這當然需要大量數據;二是要快速高效,如何保證快速做出安全評價而不影響船期,這就需要采集相對較少的關鍵數據對船舶進行快速評價。文中引入特征選擇算法(ReliefF)[1]對船舶各項安全評價指標進行篩選,并計算出各項的分類權重,避免了處理原始數據時的數據冗余以及人為確定各評價指標主觀因素過強的弊端;引入自適應神經模糊推理系統(Adaptive Network-based Fuzzy Inference System,ANFIS)[2]可以根據評價指標迅速對船舶航行安全狀況進行分級,整個算法可以實現對船舶安全評價的自動化,精簡安全評價步驟,客觀評價安全狀態;通過ReliefF與ANFIS兩種方法的結合為船舶安全領域的研究提供一種新思路。
為了對船舶航行安全進行安全評價,本文分三個模塊對問題進行研究。首先是船舶安全評價指標體系(Safety Assessment Index,SAI)的建立,其次是基于ReliefF精簡SAI,最后利用ANFIS建立風險預測模型,評價船舶航行安全狀況,具體流程如圖1所示。

圖1 研究方法
研究基于水上交通運輸的復雜系統安全評價問題,本文借助了陳偉炯的MMEM模型[3],把水上船舶交通運輸系統分為四個方面進行研究,各部分相互獨立又有耦合之處,評價結果是整個部分作用所得,各個部分又由于評價指標不同,需單獨研究。

表1 船舶安全評價因素等級表
2.2.1 人員因素評價指標體系
在水上交通安全評價中,甚至只要涉及到人的安全評價中,人員因素一直是研究的難點和重點。本文搜集整理了影響船舶航行安全的人員因素,現對船舶航行安全人員相關因素評價指標整理如表2所示。
2.2.2 船舶因素評價指標體系
由于近年來造船行業發展迅速,表中評價指標肯定有所疏漏,在咨詢了大連海事大學多位專家后得出表3中評價指標。

表2 船舶人員因素評價體系表

表3 集裝箱船船舶因素評價體系表
2.2.3 管理因素評價指標體系
本文實例數據基于“高河輪”[4],在研究管理因素時查閱了船東——中遠集裝箱運輸有限公司的各項管理規章制度,并根據大連海事大學專家給出了意見予以補充完善,如表4所示。
2.2.4 環境因素評價指標體系
本文建立的環境評價指標包括自然環境和社會環境兩部分。本文結合孫志堂安全顧問的意見以及大連海事大學專家的建議建立了環境因素評價指標,如表5所示。

表4 集裝箱船管理因素評價體系表

表5 集裝箱船環境因素評價體系表
ReliefF算法是目前應用較為廣泛的數據挖掘方法之一。遵照特征選擇算法的框架,根據本文需要,將ReliefF算法應用在指標體系的精簡問題當中,具體計算流程如圖2[5]。
1)輸入算法參數,包括樣本集D,迭代次數m,臨近樣本個數k;

圖2 ReliefF算法流程圖
2)函數輸出為各特征指標的權重值,需初始化權重向量ω為零向量;
3)從樣本集中隨機選擇樣本Ri,抽取k個同類最鄰近實例樣本Hj,并抽取與Ri不同類的實例中選出k個最鄰近實例樣本Mj(c);
4)計算權重,直至達到循環次數后停止計算;
5)輸出各特征權值。
輸出的權重值目的在于找出能夠對船舶安全評價有影響力的評價指標,淘汰掉權重值不合適或者計算中容易產生冗余的特征指標。在ANFIS運算中,參數越多代表了運算的時間復雜度和空間復雜度越大,對運算效率產生了重要影響,所以很有必要對參與ANFIS運算的評價指標進行精簡。文獻[6]中提出了基于均方差的淘汰規則。
ReliefF計算的權重值僅對特征指標刪減有意義,在ANFIS計算中還需要輸入用于安全評價的特征指標權重值。目前應用廣泛且認可度較高的賦權方法是以問卷調查為基礎,采用層次分析法(AHP)來賦權[7]。
ANFIS算法結合了模糊推理與神經網絡算法的優點[8],利用了神經網絡自動從輸入輸出數據中提取規則的能力,使算法具有神經網絡自適應學習的能力與模糊控制處理模糊信息的功能,令系統能夠自適應、自學習[9]。
整個船舶安全評價系統是一個拓撲結構,由人員、船舶、管理、環境四個子分支組成,整個系統是多個ANFIS組成的分層次網絡結構[10]。以人員因素為例,建立的ANFIS評價網絡拓撲結構如圖4所示。

圖3 ANFIS模型構建流程圖

圖4 人的因素ANFIS評價網絡拓撲結構
在構建各等級ANFIS模型時,最低等級評價指標輸入為各評價指標的風險值,由調查問卷所得,對于ANFIS所需要的評價指標則由ReliefF篩選后確定。
在確定各輸入變量的隸屬度函數時,由于非線性隸屬度函數具有良好的擬合能力,一般隸屬度函數有高斯型和鐘形[11],本文選擇高斯型隸屬度函數。
對“高河輪”所做調查問卷表進行分析,將3477組數據組成的樣本集D利用ReliefF進行處理。其中共涉及到61個底層船舶特征,樣本集為安全評價樣本集,樣本類別3,迭代次數100次,臨近樣本個數取2。計算出分類權重值為表6。
分類權重數據均分布在2倍標準差范圍之內,其中1倍標準差之內數據為49項,12項數據在1倍標準差之外。所以,秉持降低維度的目的,根據評價指標的淘汰規則,可以將1倍標準差之外的數據淘汰掉。

表6 分類權重值
由于船舶安全評價指標發生了變化,淘汰掉12項后,各評價指標的權重值勢必要發生變化,首先利用層次分析法對現有評價指標的權重W進行計算。
利用ANFIS對船舶航行進行評價,按照系統搭建步驟,首先需要生成歷史數據,根據對船舶風險預先控制方法的研究[12],產生100組歷史數據。將“高河輪”數據、四級評價指標權重值作為測試數據用于系統訓練,輸出結果如表8。
系統訓練前后人員因素、船舶因素、管理因素、環境因素隸屬度函數如圖5所示。
其中在多次訓練后,計算訓練后神經模糊系統的輸出與訓練數據的均方根誤差如表9。
從訓練前后隸屬度函數圖變化不大以及均方根誤差可以看出,ANFIS預測效果非常不錯,說明搭建的系統比較成功,能夠在保持較高精度的前提下成功預測船舶航行安全狀態。

表7 四級評價指標權重值


圖5 隸屬度函數圖

表8 系統輸出

表9 均方根誤差
最后通過圖6可知,在57組測試數據中,60分以上有46組,其中70分與80分之間34組,占總評價指標的60%,多次訓練后均方根誤差均較小,說明匹配度完好。經過系統評價后可以看出,船舶基本處于“一般安全”的狀態,評價指標預測值符合實際情況。

圖6 評價結果散點圖
本文遵循船舶安全評估的一般思想,建立61項底層評價指標,通過ReliefF算法,結合淘汰規則,淘汰掉了12項評價指標,取得了不錯的效果。同樣用AHP計算權重值,對比篩選后與篩選前的評價指標權重值,數據變化量級為10-2~10-3,變化并不劇烈,也從一個側面顯示,ReliefF算法淘汰的評價指標均是對安全評價結果影響不大的項,可視情況去除掉。ANFIS安全評價系統結合了模糊評價與神經網絡的優點,通過實例驗證發現,能夠建立符合現狀的評價指標風險值與船舶綜合風險的關系。