陳雨嘉,王競慧,韓越,余湛
(陜西師范大學心理學院,西安 710062)
人工神經網絡(Artificial Neural Network,ANN)是對生物神經網絡或者人腦抽象表示和建模,它是一種由大量處理單元組成的并行處理、非線性、自適應系統[1]。與傳統的線性模型相比,具有較高的容錯性和非線性性以及自組織性能和優秀的自我學習是人工神經網絡模型的特點,所以與其相關的理論與應用在目前已經成為研究的熱點領域,研究前景廣闊[2]。
人工神經網絡屬于人工智能的分支,是一種利用模仿生物神經網絡來進行并行分布式信息處理的算法模型[3]。人工神經網絡雖然只是對生物神經網絡的基礎層面模仿、簡化和抽象,但其已能反映人腦功能的若干特性,可以利用經驗進行學習和自我組織。人工神經網絡不需要執行指令,并行的處理輸入數據,且當其中一個或幾個神經元停止運行時,整個系統仍能保持正確的輸出,容錯與容噪性較強[4]。一種特定的人工神經網絡的特性體現于其拓撲結構之中,即神經元之間的權值和閾值以及傳遞函數。
1988年Broomhead和Lowe根據生物神經元具有局部相應的原理,將徑向基函數引入神經網絡中,很快,RBF神經網絡被證明對非線性結構具有一致逼近的性能,逐步在不同行業和領域得到了廣泛應用[5-7]。本研究使用的RBF神經網絡的結構圖如圖1所示,為三層構成前饋型局部逼近神經網絡,第一層為輸入層,神經元數等于輸入的維數(基于時間的家庭—工作沖突、基于壓力的家庭—工作沖突、基于行為的家庭—工作沖突、體力疲勞、活力減少、動力下降以及腦力疲勞);第二層稱為隱含層或RBF層,它包含100個神經元;最后一層為輸出層,其神經元數等于輸出數據的維數(安全情境績效與安全任務績效)。RBF神經網絡的第k個輸出神經元的輸出量可通過式1計算[8-9]:
(1)

其中‖P-cj‖2為輸入向量P和第j個神經元中心cj的歐幾里得距離,
飛行安全績效是航空安全管理的關鍵內容,對影響飛行員安全績效因素的探究也一直是航空心理學研究者們關注的焦點問題。在如何評價安全績效上,傳統上主要有兩種評價方式,一種是是用安全結果進行評價;另一種用安全績效行為進行評價,強調個體層面[10],即用可量化的事件或者結果進行表述,屬于組織層面。基于不同的研究,對于飛行員安全績效的界定也不盡相同。而一種既包含結果又納入行為的更為全面的說法是在安全情境績效和安全任務績效兩個維度上對飛行員的安全績效進行評價[11]。
李永娟等人[12]構建了工作壓力與安全績效的關系模型,將壓力源分為挑戰性壓力源和沮喪性壓力源。有研究發現:工作回報、角色沖突、家庭沖突、工作任務、人際沖突等是民航從業者的主要壓力來源。家庭—工作沖突是家庭與工作兩個領域的角色沖突,也屬于沮喪性壓力源,沮喪性壓力會阻礙個體目標的完成,影響工作績效[13]。大量其他職業領域的研究也發現,家庭-工作沖突會影響人們的職業倦怠、工作投入和安全,從而對基層員工的工作績效產生負向影響[14-15]。
此外,飛行疲勞也會影響飛行員的安全績效,Gregory等人[16]的研究發現,84%的飛行員報告說飛行疲勞影響他們的飛行績效。Gander等人[17]的研究得出睡眠、晝夜喚醒歷史等是評價飛行員安全績效的重要指標,晝夜交替不規律、睡眠不足等較大的影響著飛行員的安全績效。這是因為疲勞降低了個體對外部環境的知覺和感受性,同時,飛行疲勞導致飛行員個體機能效率的下降,容易產生錯誤判斷,引發飛行錯覺,甚至最后錯誤操作而引發航空事故[18-20]。
人工神經網絡模型適用于研究安全績效有以下幾點原因:其一,安全績效并不是一個單一的變量而是一個二維的變量,而同時分析兩個維度的變量傳統的回歸分析方法無法做到,但人工神經網絡不僅能夠同時分析安全績效的兩個維度,而且還能分析這兩個維度間的相互依存關系[21];其二,由于飛行員安全績效與其影響變量間是否有一種線性關系無法確定,故傳統線性分析方法不一定能準確描述變量間的關系,而利用足夠的精度人工神經網絡模型能趨近于任意的連續函數,建立起安全績效及其影響變量的線性或非線性模型[22-23];最后,傳統的統計模型在提升變量預測精確度方面存在著不足,解決這一問題需要引進新分析方法。
為了更精確的建模飛行員安全績效與飛行疲勞、家庭沖突間的關系,同時也為了探索新的研究方法,本研究采用RBF人工神經網絡模型對飛行員安全績效的影響因素進行建模,通過與傳統多元回歸模型進行比較,以分析神經網絡模型的性能;采用3D繪圖技術繪制變量間的3D著色表面圖,以精確描述并分析變量間額關系。
由于被試的特殊性,共回收有效問卷為259份,有效回收率為90.1%。我國民航飛行員多為男性,因此參與問卷調查的飛行員均為男性。被試年齡范圍是22歲—47歲,平均年齡31.94 (SD=7.92)。
2.2.1 家庭—工作沖突量表
使用Carlson和Kacmar編制的[24]工作家庭沖突量表中的家庭—工作沖突分量表,共9個項目,分為三個維度:即行為沖突、壓力沖突和時間沖突。采用Likert5點計分,從 1(非常不符合)到 5(非常符合),得分越高表示家庭—工作沖突程度越高。本研究中該量表總的Cronbach α系數為0.904,其中行為沖突Cronbach α系數為0.701,壓力沖突Cronbach α系數為0.745,時間沖突Cronbach α系數為0.717。
2.2.2 飛行疲勞量表
采用中文版多維疲勞量表(MFI-20)測量飛行員的飛行疲勞。共20個項目,采用 Likert 5點計分,從 1(非常不符合)到5(非常符合),得分越高表示疲勞水平越高。該量表包括腦力疲勞(Mental Fatigue)、動力下降(Reduced Motivation)、活力減少(Reduced Activity)以及體力疲勞(Physical Fatigue)四個維度。在本研究中多維疲勞量表總的Cronbach α系數為0.911,其中腦力疲勞的Cronbach α系數為0.802,動力下降的Cronbach α系數為0.726,活動減少的Cronbach α系數為0.887,身體疲勞的Cronbach α系數為0.91。
2.2.3 安全績效量表
采用[25]安全績效二維模型,將飛行員的安全績效分為安全任務績效和安全情境績效。共9個項目,分二個維度:安全情境績效和安全任務績效。采用Likert7點計分,得分越高表示安全績效越高。安全績效量表的總的Cronbach α系數為0.713,其中安全情境績效的的Cronbach α系數為0.762,安全任務績效的Cronbach α系數為0.70。
2.3.1 統計分析
本文采用Pearson積差相關分析家庭工作沖突、飛行疲勞各維度之間的相關性,采用多元回歸分析研究家庭—工作沖突和飛行疲勞對每個安全績效維度的影響,并使用交互驗證的方法來驗證回歸模型的普適性:即使用85%的數據來構建回歸模型,剩余15%的數據來檢驗該模型的預測準確性。所有統計分析的結果都作為一種參照,用來檢驗神經網絡模型的性能。所有的統計分析采用Matlab R2016b進行。

圖2 原始數據的處理過程
2.3.2 RBF神經網絡分析
在應用RBF神經網絡模型之前,需要對原始數據進行預處理[26],預處理過程如圖2所示。首先,將原始數據轉化為Matlab中的矩陣形式,然后,對數據中的缺失值進行檢查,刪除6組缺失的數據。接下來,對原始數據進行歸一化處理,即將原始數據的取值范圍固定在[-1,1]。歸一化處理后,將數據分為兩部分,一部分(220組)的數據用于網絡的訓練,另一部分(39組)的數據用于網絡預測精度的驗證。訓練組與驗證組數據為隨機劃分,這一劃分重復進行三次,以便降低數據中極端數值對網絡性能的影響。RBF神經網絡分析通過Matlab R2016b軟件實現。
為了構建本研究所需的、具有良好性能的RBF神經網絡,需要設定神經網絡如下的幾個參數:
徑向基層神經元的數量:在Matlab神經網絡工具箱默認狀態下,經向基層神經元數量與輸入數據的數量相同,以本實驗來說,其數目等于220。由于神經元數量過大會使得網絡過度收斂和訓練速度降低,為了選取適當的神經元數量,本研究采用自組織聚類分析法將220個神經元數量縮減為100個。
徑向基函數的擴展速度:本研究中擴展速度設置為2.2。
為了更直觀的描述神經網絡模型所建構的變量之間的關系,本文使用Matlab的3D繪圖技術繪制輸入與輸出變量間的3D著色表面圖。
本文研究的自變量的平均數、標準差、四分位差以及相關系數如表1所示,可以看出所有變量間都存在顯著的相關關系。

表1 變量間的描述統計與相關關系
注:*代表P<.05,**代表P<.01。
多元線性回歸分析結果如表2所示。從表中可以看出,從表中可以看出,在安全任務績效維度,基于時間、壓力的家庭—工作沖突、身體疲勞與動力下降為影響安全任務績效的主要變量,除動力下降維度外,其他三個變量都與安全任務績效呈負相關;在安全情境績效維度,基于壓力的家庭—工作沖突與身體疲勞為主要影響因素,相比之下,基于壓力的家庭—工作沖突的影響更加顯著。對于所有兩個維度來說,基于壓力的家庭—工作沖突都是一個極其顯著的影響維度。
表2多元線性回歸結果

本節建立了RBF神經網絡模型,通過模型擬合數據與真實數據進行分析得到了模型的決定系數R2以及t檢驗結果(t,p),并將該結果與多元回歸模型進行了對比,對比結果如表3所示。

表3 多元線性回歸與RBF神經網絡模型評價標準
從表3中可以看出,RBF神經網絡模型在安全績效的兩個維度的決定系數為0.78和0.70,均高于多元線性回歸,以平均值來看,RBF神經網絡模型的決定系數比多元線性回歸模型的決定系數高出的26%。對于測試樣本來說,其可靠性系數R2表示真實數值與預測數值的準確程度。對于安全情境績效維度來說,RBF神經網絡模型輸出值與真實值之間的決定系數為0.71,說明此時RBF神經網絡模型的預測準確度為71%,而對于多元回歸模型,其決定系數為0.46,說明只有46%的預測準確度。以平均值來看,RBF神經網絡模型的預測準確度比多元線性回歸模型高出37%。
另一方面,從t檢驗的結果來看,雖然兩種模型與真實數據間的t檢驗都沒有明顯的差異,但是相比于多元線性回歸模型,RBF神經網絡模型在預測數據方面具有更小的t值與更大的p值,說明該模型的具有更好的建模特性。這樣的研究結果也揭示了變量間存在的非線性關系。
基于RBF神經網絡模型繪制出的部分變量間的3D著色表面圖如圖3所示。圖中z軸表示被預測變量,即安全績效中的某一維度,x軸和y軸表示預測變量,即家庭—工作沖突和飛行疲勞中的某兩維度。從4個變量間的3D著色表面圖中顯示出的曲面而非平面的形狀表明了變量間的非線性關系。

圖3部分變量間的3D著色表面圖
(a)基于壓力和時間的家庭—工作沖突與安全任務績效的關系;(b)基于壓力和時間的家庭—工作沖突與安全情境績效的關系;(c)身體疲勞和基于壓力家庭—工作沖突與安全任務績效的關系;(d)身體疲勞和基于壓力的家庭—工作沖突與安全情境績效的關系
隨著計算機技術的迅速發展,人工神經網絡技術已成功應用于工業生產、自動化、生物、醫學、經濟等眾多領域[27],作為一種探索,本文將RBF神經網絡模型應用于飛行員安全績效的人因學建模中,希望能夠促進人工神經網絡在人因學領域中的應用,并為類似研究提供一種新的研究方法。
從神經網絡模型與多元線性回歸模型的對比結果中,不難發現神經網絡模型有更高的建模與預測性能,相比于傳統回歸模型,是一種更好的建模方法,而這也與相關類似的研究結論相吻合[21,26,28-38]。其原因在于變量間的非線性關系。在傳統的最小二乘回歸模型中,需要事先指定模型的形式以及自變量與因變量之間的關系,對于線性回歸模型,變量之間的關系被事先假定為線性的,且即便線性回歸的誤差很小,也不能完全確定變量間的線性關系;而人工神經網絡模型不受這些條件的約束,且其自身具有優越的非線性擬合能力使其在研究非線性變量間的關系時有著得天獨厚的優勢。
基于人工神經網絡模型所繪制的3D著色表面圖(圖3)具象地描述了家庭—工作沖突、飛行疲勞與安全績效之間的非線性關系,且通過進一步分析曲面的形狀,還能進一步分析變量間的關系。總的來說,圖3中的四個3D著色表面圖都展現出一種時平緩—陡峭接連出現的曲面形狀,說明家庭—工作沖突和飛行疲勞對安全績效的影響是不斷變化的。具體來看,以圖3a為例,當基于壓力與時間的家庭—工作沖突較高或是較低時(圖中上下兩角),安全工作績效的隨上述兩變量增加而下降的速率較快;而當壓力與時間的家庭—工作沖突適中時,安全任務績效的變化較為平緩。這一平緩變化的區域類似于一個有上下“閾限”的緩沖區,大于或者小于上下閾限都會使得安全任務績效急速變化。再以圖3d為例,當家庭—工作沖突很高時,飛行疲勞對安全情境績效的影響并非是單調下降的,而是呈現一種先增后減的倒U型形狀(圖中右側部分),表明當基于壓力的家庭—工作沖突很高時,飛行疲勞可以一定程度地提升飛行員的安全情境績效。
本研究所得的結果表明,作為一種新的研究方法,人工神經網絡這種非線性分析方法在人因學相關研究領域中的有著較為廣闊的應用前景。這種方法具有較高的靈敏度,便于研究者探究變量間的細微的變化關系。以本研究為例,基于壓力與時間的家庭—工作沖突對安全任務績效的影響為何時而平緩,時而劇烈;以及為何在高基于壓力的家庭—工作沖突時,飛行疲勞反常的影響了安全情境績效,這些都是值得研究者未來進行深入理論探索的地方。
盡管本研究應用RBF神經網絡模型對飛行員安全績效的研究得到了不錯的結果,但也需指出本研究的不足之處。首先,由于本研究中模型的建立基于自評量表所測量的數據,但這種測量方法可能會因同源方差或被試期望一致回答而對結果的客觀性產生負面影響。基于這一點不足,未來的研究應引入客觀的測量方法,如請被試的同事或是熟人對其進行評價。其次,本研究采用的是橫斷的測量方法,對各研究變量的因果關系無法分析,因此,在未來的研究中可采用縱向研究測量方法進行研究。最后,為了更深一步的探討人工神經網絡模型與傳統統計模型,未來的研究可將神經網絡模型與中介或調解效應模型進行對比與分析。