蔡 平,冒劉燕
(1.江蘇海事職業技術學院,南京 211170;2.東南大學交通學院,南京 210096)
隨著我國船舶工業技術的不斷發展,安全管理工作倍受重視,船舶生產中傷亡事故的統計分析工作已成為安全管理的一項基礎工作[1]。根據海因里希事故致因理論,事故規律的挖掘是建立在輕微事故的統計分析基礎之上的。由于輕微事故的發生具有因果性、隨機性和普遍性等特點,事故與事故之間不可避免地會具有某些關聯,統計的指標也會存在信息的重疊[2]。如果運用一般的統計方法,這種信息重疊會阻礙我們對事故特征與內在規律的準確認識。主成分分析正是研究如何通過原來變量的少數幾個線性組合來解釋原來變量絕大多數信息的一種多元統計方法[3]。為了消除信息重疊的影響,本文引入主成分分析法,對船舶生產企業中的輕微事故進行分析,揭示事故之間的內在聯系,得到事故特征及其發展規律,為企業的安全生產提供有意義的決策參考。
主成分分析也稱主分量分析,是由霍特林(Hoteling)于1933年首先提出的。主成分分析是利用降維的思想,在損失很少信息的前提下,把多個指標轉化為幾個綜合指標的多元統計方法[4]。通常把轉化生成的綜合指標稱為主成分,其中每個主成分都是原始變量的線性組合,并且各個主成分之間互不相關,使得主成分比原始變量具有某些更優越的性能。主成分分析的計算步驟如下:
1)對原始數據進行標準化處理。對于一個樣本資料,觀測p個變量x1,x2,…,xn,n個樣品的數據資料陣為:

為了消除變量之間在數量級或量綱上的不同,對數據進行標準化變換:
2)計算樣本相關系數矩陣。

經標準化處理后的數據的相關系數為:

3)求相關系數矩陣特征值和特征向量。由特征方程|λg-R|=0,求出 p 個特征根 λ1,λ2,…,λp,并將其按照從大到小的順序排列為 λ1≥λ2≥…≥λp≥0。λ是主成分的方差,其大小描述了各個主成分在被評價對象上所起作用的大小[5,6]。
4)選擇重要的主成分,并寫出主成分表達式。主成分分析可以得到p個主成分,根據各個主成分貢獻率ei的大小選取前k個主成分。

貢獻率越大,說明該主成分所包含的原始變量的信息越強。k的選取,一般要求累計貢獻率達到85%以上。
5)計算主成分。然后對k個主成分進行綜合評價,可先求每一個主成分的線性加權,再對k個主成分進行加權求和,得最終評價值。
收集到某船舶生產企業2012年輕微事故記錄,得出事故類型的統計資料,原始數據如表1所示。
由于事故類型較多,將原始數據中的各類事故分別表示為x1車輛傷害、x2觸電、x3高處墜落、x4火災、x5機械傷害、x6其他爆炸、x7其他傷害、x8起重傷害、x9物體打擊、x10中毒和窒息、x11灼燙、x12淹溺。
首先對原始數據做標準化處理,得出標準化后的數據如表2所示。
運用SPSS軟件進行主成分分析,計算出相關系數矩陣及特征值如表3和表4所示。
表4中列出了計算之后所有主成分的特征值主成分貢獻率及累計貢獻率,所有主成分的特征值按照從大到小的順序排列,可見第一個主成分的特征值為9.285,它解釋了總變量的77.373%;第二個主成分的特征值為1.095,它解釋了總變量的9.127%。第一主成分和第二主成分的累計貢獻率達到86.500,超過了主成分分析法中規定的85%,所以選取第一主成分和第二主成分,并認為它們基本包含了以上12個指標的所有信息。其中,第一個主成分又是最重要的,包含的信息最多,對事故分析影響最大。據此可提取的主成分矩陣如表5所示。
根據主成分計算步驟可得出第一、第二主成分表達式分別如下:表示對原始變量標準化后的變量。

其中,

表1 2012年某高危企業輕微事故統計

表2 標準化數據

表3 相關系數矩陣

表4 特征值與主成分貢獻率以及累計貢獻率

表5 成份矩陣
將表2中的標準化數據代入主成分表達式中,可以得出12個月的主成分得分,如表6所示。并將這12個月的得分在平面直角坐標系中繪制出來,得到主成分得分二維圖,如圖1所示。
1)從時間上來看。從圖1中可以看出,分布在第一象限的是4、5、7三個月,分布在第四象限的是6月份,這四個月的安全事故發生情況在全年來說是最多的,安全狀況最差。這跟第一、第四象限的主要特征是第一主成分、占信息總量的比重最大有關。并且5、6、7月份的第一主成分得分最高,說明安全狀況最差,建議該企業將這三個月份作為重點安全生產月份來抓。

表6 主成分得分

圖1 主成分得分二維圖
處于第三象限的2月份,由于其第一主成分得分y1最低,安全情況最好。處于y2軸附近共有9、10、11、12四個月份,這四個月份得分非常接近,說明這四個月安全狀況基本一致,并且可以只用第一主成分就可以解釋它們的安全狀況。
2)從事故類型來看。根據第一主成分表達式,高處墜落、機械傷害、起重傷害和物體打擊事故所占權重比例最大,對企業安全影響最為嚴重。另外,這四類事故之間存在較強的相關性。說明這幾類事故的致因之間是有聯系的,引發一類事故的原因,在某種情況下也有可能造成另一類事故,因此在制定預防措施時必須綜合考慮這種聯系。對企業而言,可以將這幾類事故的隱患作為重點檢查和整治對象,以減少事故發生率,促進安全生產。
船舶生產企業輕微事故多,類型復雜,如果只利用簡單的數學統計,就會忽略各類事故間的聯系和相關性,無法充分認識到事故致因之間的聯系,因而無法運用系統的觀念對這些數據進行處理。主成分分析在研究復雜問題時就可以只考慮少數幾個主成分而不至于損失太多信息,從而更容易抓住主要矛盾,揭示事物內部變量之間的聯系和規律性,同時使問題得到簡化,提高分析效率。
[1]周明順. 船舶建造安全概論[M]. 北京: 人民交通出版社, 2011.
[2]李慧敏, 龐奇志, 鄒偉霞. 主成分分析法在煤礦事故統計分析中的應用[J]. 安全與環境工程, 2012, 19(3):77-79.
[3]何曉群. 多元統計分析[M]. 北京: 中國人民大學出版社, 2004.
[4]張文彤. SPSS統計分析高級教程[M]. 北京: 高等教育出版社, 2004.
[5]Bilodeau M, Duchesne P. Principal component analysis from the multivariate familial correlation matrix[J].Journal of Multivariate Analysis, 2002, 82(2): 457-470.
[6]王家遠, 葉銀川. 主成分分析法評價地區建筑業競爭力[J]. 深圳: 深圳大學學報理工版, 2009, 26(1):92-97.