高揚(yáng), 李曉宇, 劉敬輝, 李涵秋, 齊彥昆
(中國國家鐵路集團(tuán)有限公司鐵路安全研究中心, 北京 100081)
隨著鐵路運(yùn)輸組織及行車安全技術(shù)的不斷進(jìn)步,操作人員的工作由過去的,以單一“操作”為主,變?yōu)椤氨O(jiān)視-判斷-決策-控制”一體化,發(fā)生人因失誤的可能性及其后果和影響變得更大,存在潛在危險(xiǎn)集中到了較少的關(guān)鍵安全崗位人員身上。作為高速鐵路行車指揮中樞,調(diào)度指揮系統(tǒng)在保障行車安全方面發(fā)揮著不可替代的作用,特別地,在非正常行車的應(yīng)急場(chǎng)景下,調(diào)度人員的操作對(duì)列車的安全運(yùn)營起著決定性的作用。在高速鐵路行車,尤其是在非正常行車的應(yīng)急場(chǎng)景下,調(diào)度人員的操作對(duì)列車的安全運(yùn)營起決定性作用。列車調(diào)度自動(dòng)化程度的提高,一方面減輕了調(diào)度員的日常操作作業(yè)量,但是需要盡可能長時(shí)間集中注意力,密切注視調(diào)監(jiān)屏的動(dòng)態(tài)變化;另一方面,當(dāng)故障場(chǎng)景發(fā)生時(shí),需要調(diào)度員迅速、正確地針對(duì)突發(fā)事件進(jìn)行應(yīng)急處置。
近年來,隨著人因工程學(xué)的發(fā)展,在研究人的失誤時(shí),人們不再局限于表現(xiàn)出來的失誤行為,而是越來越關(guān)注其背后的產(chǎn)生機(jī)制和影響機(jī)理。在已有的人因研究中,有研究者基于共享心智模型構(gòu)建了關(guān)鍵安全崗位人員的安全共享心智模型,并驗(yàn)證了其對(duì)人員安全績效的有效預(yù)測(cè)作用[1]。有研究者基于心理負(fù)荷理論模型,對(duì)調(diào)度員心理負(fù)荷的波動(dòng)情況進(jìn)行調(diào)研檢測(cè)及建模監(jiān)測(cè),從而確定調(diào)度員心理負(fù)荷與內(nèi)外多方面因素的影響作用關(guān)系[2]。針對(duì)調(diào)度員的工作績效研究中,研究者分別從工作滿意度和個(gè)性特征的角度出發(fā),對(duì)二者在心理負(fù)荷的中介效應(yīng)和調(diào)節(jié)效應(yīng)進(jìn)行了驗(yàn)證,并進(jìn)一步探討了其深層次的內(nèi)在影響機(jī)制,從而證明了心理負(fù)荷對(duì)工作績效及其子維度的預(yù)測(cè)作用[3]。在對(duì)認(rèn)知科學(xué)相關(guān)文獻(xiàn)研究的基礎(chǔ)上,有研究者結(jié)合高速鐵路調(diào)度員工作特性、調(diào)研訪談結(jié)果,確定了高鐵調(diào)度員認(rèn)知能力構(gòu)成;通過相關(guān)性分析得到調(diào)度員認(rèn)知能力與安全績效各維度的影響關(guān)系,結(jié)合調(diào)節(jié)效應(yīng)分析,證明了安全氛圍在認(rèn)知能力與安全績效中存在顯著的正向調(diào)節(jié)作用[4-6]。
面向高鐵調(diào)度員的認(rèn)知決策模型的影響因素較多,各因素之間關(guān)聯(lián)性不強(qiáng),為了對(duì)高鐵調(diào)度員的認(rèn)知決策模型進(jìn)行更有效率的優(yōu)化,現(xiàn)借助支持向量機(jī)和粒子群優(yōu)化方法,建立聯(lián)合優(yōu)化模型;提出一系列利用客觀測(cè)量數(shù)據(jù);通過回歸模型角度進(jìn)行研究,建立更加性能優(yōu)化的高鐵調(diào)度員的認(rèn)知決策模型。針對(duì)當(dāng)前鐵路領(lǐng)域人因研究中存在的數(shù)據(jù)匱乏問題可以有效彌補(bǔ),將定性問題深入到定量研究的層次中。
結(jié)構(gòu)方程模型(structural equation modeling,SEM) 是一種建立、估計(jì)和檢驗(yàn)變量之間復(fù)雜關(guān)系模型的方法。模型中既包含可以通過測(cè)量手段被觀測(cè)到的顯在變量,也包含無法直接測(cè)量其值的潛在變量,除了心理學(xué)等社會(huì)科學(xué)范疇,也廣泛應(yīng)用于交通運(yùn)輸、人因技術(shù)等工程學(xué)領(lǐng)域。
結(jié)構(gòu)方程模型理論的基本原理為,利用一定的統(tǒng)計(jì)手段,對(duì)假設(shè)模型與樣本數(shù)據(jù)之間關(guān)系的一致性程度進(jìn)行分析比較,評(píng)價(jià)假設(shè)模型與實(shí)際模型的近似程度,從而處理復(fù)雜現(xiàn)象背后的理論模式,達(dá)到對(duì)實(shí)際問題進(jìn)行定量研究的目的。
結(jié)構(gòu)模型反應(yīng)潛變量之間的因果關(guān)系,亦稱潛變量模型,也稱因果模型。其中的方程成為結(jié)構(gòu)方程,具體表達(dá)式為
η=Bη+Γξ+ζ
(1)
式(1)中:η為內(nèi)生潛變量,既影響其他變量,也受其他變量影響;ξ為外生潛變量,只影響其他變量,不受其他變量影響;ζ為η中未能被解釋的部分;B為一個(gè)因果系數(shù),表示Bη對(duì)η的影響;Γ為一個(gè)系數(shù)矩陣,表示Γξ對(duì)η的影響。
在圖1中,ξ1是外生潛變量;η1和η2是內(nèi)生潛變量;直線箭頭從ξ1指向η1和η2;ξ1是η1和η2的原因變量,它們之間的路徑系數(shù)分別為γ11和γ12;直線箭頭從η1指向η2,表明η1會(huì)影響η2,路徑系數(shù)為β2。類似的,可以得到各個(gè)潛變量之間的路徑系數(shù),這些都是待估計(jì)的參數(shù)。因此,圖1的模型可以寫為
(2)

圖1 結(jié)構(gòu)模型示意圖Fig.1 Time-domain feature map of EEG under different cognitive load levels
Wickens從信息流的角度出發(fā),分析人在完成作業(yè)任務(wù)時(shí)一連串的心理加工階段,提出了一種人的信息加工(human information processing)模型[7],如圖2所示。

圖2 Wickens信息處理模型Fig.2 Wickens information processing model
在人與外界發(fā)生交互時(shí),外界的信息首先由視覺、聽力、觸覺等感覺系統(tǒng)進(jìn)行接收和加工,Wic-kens[7]將這一過程標(biāo)記為“感覺(sense)”,并強(qiáng)調(diào)其與“知覺(perception)”的不同。他認(rèn)為外界的信息需要先短暫(不超過1 s)地存儲(chǔ)在短時(shí)感覺存儲(chǔ)(short term sensory store,STSS)這一模塊中,然后只有其中的一小部分感覺信息會(huì)繼續(xù)傳遞,被人真正地知覺。如何選擇哪些信息被繼續(xù)傳遞,涉及對(duì)感覺到的聲音或圖像信號(hào)以及事件的意義的判斷,而這種判斷背后的標(biāo)準(zhǔn)則是基于既有的知識(shí)或以往的經(jīng)驗(yàn),即長期記憶(long term memory)中所存儲(chǔ)的內(nèi)容。
知覺過后,信息流向兩個(gè)通道或二者之一。對(duì)于部分高度熟練的操作行為,輸入信息能夠觸發(fā)下意識(shí)的即刻反應(yīng),整個(gè)加工流將直接進(jìn)入反應(yīng)選擇(response selection)階段并采取反應(yīng)執(zhí)行(response execution);但在部分復(fù)雜情境中,人需要使用工作記憶(working memory)對(duì)知覺信息進(jìn)行暫時(shí)存儲(chǔ)和認(rèn)知加工,一方面獲取更多的外界信息,另一方面對(duì)知覺到的信息進(jìn)行解釋,然后才能選擇恰當(dāng)?shù)姆磻?yīng)。
在上述對(duì)Wickens模型的分析中可以發(fā)現(xiàn),該模型的核心就在于引入了記憶和注意兩個(gè)認(rèn)知要素,對(duì)其在信息處理過程中的產(chǎn)生影響的作用機(jī)理進(jìn)行解釋。但是需要注意到,記憶和注意兩個(gè)認(rèn)知活動(dòng)自身也會(huì)受到其他因素的影響。Wickens的模型中已經(jīng)提到:人的工作記憶容量和注意資源都是有限的,認(rèn)知負(fù)荷的有關(guān)理論研究中認(rèn)為,正是這種有限性導(dǎo)致了認(rèn)知負(fù)荷的產(chǎn)生和波動(dòng)[8]。注意-情境意識(shí)模型(attention-situation awareness, A-SA)發(fā)現(xiàn),合理的注意力分配可提高情境意識(shí)水平而降低腦力負(fù)荷[9]。另一方面,認(rèn)知負(fù)荷或腦力負(fù)荷的變化又會(huì)影響注意力資源和工作記憶的使用。知覺負(fù)載理論和認(rèn)知控制理論認(rèn)為,對(duì)于不同的認(rèn)知階段,腦力負(fù)荷的升高會(huì)導(dǎo)致人對(duì)外界干擾信息的注意資源配給產(chǎn)生促進(jìn)或抑制作用[10]。過高的任務(wù)負(fù)荷也可能導(dǎo)致工作記憶過載,無法及時(shí)獲取新的外界信息進(jìn)行處理[11]。
根據(jù)上文所闡述的腦力負(fù)荷與注意和記憶之間的相互作用關(guān)系,本文研究以Wickens模型為基礎(chǔ),添加腦力負(fù)荷要素,用以更細(xì)節(jié)地探究和解釋認(rèn)知決策過程。特別地,借鑒Endsley提出的情景意識(shí)理論,采用具有相同語義的“感知”和“理解”概念,分別對(duì)Wickens信息模型中的“感覺儲(chǔ)存”和“知覺編碼”進(jìn)行替換。同時(shí),對(duì)未來狀態(tài)的預(yù)測(cè)將會(huì)直接決定人的決策意向,因此將“預(yù)測(cè)”與“決策”概念相融合。由此構(gòu)建的結(jié)構(gòu)模型具體形式如圖3所示。

圖3 假設(shè)結(jié)構(gòu)模型Fig.3 Hypothetical structural model
支持向量機(jī)(support vector machine, SVM)是一種通過監(jiān)督學(xué)習(xí)的方式對(duì)數(shù)據(jù)進(jìn)行分類預(yù)測(cè)的算法,其決策方程為
f(x)=WTx+b
(3)
式(3)中:W為超平面法向量;x為數(shù)據(jù)點(diǎn),為N維向量;b為偏置。
SVM在線性函數(shù)兩側(cè)制造了一個(gè)“間隔帶”,對(duì)于所有落入間隔帶內(nèi)的樣本,都不計(jì)算其損失;只有落到間隔帶之外或落在間隔帶邊緣上的樣本,才計(jì)入損失函數(shù),也就是支持向量。SVM希望所有樣本盡可能地落在間隔帶內(nèi),為此引入兩個(gè)松弛變量ξ、ξ*。
(4)

松弛變量ξ、ξ*分別表示間隔帶邊緣之外的樣本點(diǎn)到間隔帶相應(yīng)邊緣的函數(shù)距離。由此,SVM的總優(yōu)化目標(biāo)為
(5)
(6)
式中:C為一個(gè)正則化參數(shù),用于控制模型的復(fù)雜度和訓(xùn)練誤差之間的權(quán)衡;ε為一個(gè)預(yù)先定義的容差值,用于控制預(yù)測(cè)值與實(shí)際值之間的差異;i為樣本數(shù)量。
對(duì)于式(5)和式(6)的最優(yōu)化問題,一般采用拉格朗日乘子法轉(zhuǎn)換成對(duì)偶最優(yōu)化問題,然后根據(jù)KKT(Karush-Kuhn-Tucker)條件進(jìn)行最優(yōu)化計(jì)算,得到的回歸函數(shù)可以寫為
(7)
(8)

(9)
K(xi,xj)=Φ(xi)TΦ(xj)
(10)
式中:Φ(xj)為將輸入樣本xj映射到特征空間中的特征向量。
常見的核函數(shù)包括線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯核函數(shù)、sigmoid核函數(shù)等,其中,高斯核函數(shù)(RBF核)適用范圍較廣,使用頻率較高。其數(shù)學(xué)表達(dá)式為
KRBF(xi,xj)=exp(-γ‖xi-xj‖2)
(11)
粒子群優(yōu)化算法(particle swarm optimization,PSO) 是一種啟發(fā)式優(yōu)化算法,屬于進(jìn)化算法的一種,其算法流程如圖4所示。

圖4 粒子群算法流程圖Fig.4 Algorithm flow chart of PSO
粒子群算法的核心思路為,基于一組候選解(粒子),借助其自身經(jīng)驗(yàn)和種群中最優(yōu)個(gè)體的經(jīng)驗(yàn)調(diào)整其速度和位置,使其在解空間中移動(dòng),最終找到最佳位置,解決優(yōu)化問題。同時(shí),為了兼顧局部最優(yōu)和全局最優(yōu)的結(jié)果,引入一個(gè)非負(fù)的慣性權(quán)重因子ω,使得PSO算法可以適應(yīng)不同的搜索范圍需求。其值較大時(shí),粒子受學(xué)習(xí)項(xiàng)的影響較小,更趨向于沿自己的慣性方向移動(dòng),此時(shí)種群的全局尋優(yōu)能力較強(qiáng),局部尋優(yōu)能力較弱;ω較小時(shí),粒子受學(xué)習(xí)項(xiàng)的影響相對(duì)較大,此時(shí)全局尋優(yōu)能力減弱,局部尋優(yōu)能力增強(qiáng)。
為了平衡全局搜索和局部搜索能力,試將ω按照線性遞減權(quán)值(linear decreasing weight,LDM) 策略改變其值。
(12)
式(12)中:ωj為第j個(gè)樣本點(diǎn)的權(quán)重;j為時(shí)間的步數(shù)或者索引值;N為算法設(shè)定的最大迭代次數(shù);ωinit為初始慣性權(quán)重;ωend為迭代至最大迭代次數(shù)時(shí)的慣性權(quán)重,二者均需要根據(jù)算法實(shí)際應(yīng)用進(jìn)行人為設(shè)定。
測(cè)試實(shí)驗(yàn)基于實(shí)驗(yàn)室內(nèi)部獨(dú)立開發(fā)的調(diào)度指揮人員人因工程實(shí)驗(yàn)系統(tǒng)進(jìn)行。實(shí)驗(yàn)系統(tǒng)由場(chǎng)景生成管理系統(tǒng)、調(diào)度指揮仿真系統(tǒng)[13]、數(shù)據(jù)采集分析系統(tǒng)組成,能夠提供正常及故障場(chǎng)景生成與管理、調(diào)度人員人機(jī)界面及相關(guān)環(huán)境的構(gòu)建、被試人員操作行為及生理參數(shù)的采集與分析等功能[14]。
當(dāng)應(yīng)急場(chǎng)景發(fā)生時(shí),調(diào)度指揮仿真系統(tǒng)中相應(yīng)的子系統(tǒng)會(huì)做出相應(yīng)的界面提示。在故障場(chǎng)景應(yīng)急處置的過程中,被試人員在仿真平臺(tái)上進(jìn)行操作后,實(shí)驗(yàn)平臺(tái)會(huì)給出相應(yīng)的顯示或語音反饋。例如,通過調(diào)度員通信仿真子系統(tǒng)呼叫司機(jī)、要求確認(rèn)列車有關(guān)狀況后,通信仿真子系統(tǒng)會(huì)自動(dòng)播放相應(yīng)的回復(fù)語音。數(shù)據(jù)采集分析系統(tǒng)通過記錄時(shí)間戳對(duì)上述反饋刺激進(jìn)行標(biāo)記,以便在采集到的心電圖(electrocardiogram,ECG)、腦電圖(electroencephalography,EEG)和眼動(dòng)等生理數(shù)據(jù)上進(jìn)行時(shí)間軸對(duì)齊與同步。
2.1.1 腦電數(shù)據(jù)提取
腦電數(shù)據(jù)預(yù)處理基于功能軟件,對(duì)采集到的腦電數(shù)據(jù)進(jìn)行初步的預(yù)處理。包括電極定位、信號(hào)去噪、重參考 (re-reference)。EEG是一種成熟且實(shí)用的工具,用于研究大腦功能,心理學(xué)和精神病學(xué)的發(fā)展。目前,大多數(shù)發(fā)育性EEG研究為事件相關(guān)電位(ERP)分析或基于傅立葉變換的分析,但是這些分析方法忽略了非鎖相信號(hào)和時(shí)間信息。時(shí)頻分析可以更好地表征EEG數(shù)據(jù)中包含的3個(gè)振蕩特征的時(shí)間動(dòng)力學(xué):頻率、功率和相位。我們對(duì)腦電波中的信號(hào)分別提取時(shí)域特征、頻域特征、時(shí)頻域特征。時(shí)間序列分類的主流網(wǎng)絡(luò)包含長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional,CNN)、卷積神經(jīng)網(wǎng)絡(luò)-長短期記憶網(wǎng)絡(luò)(convolutional neural network-long short-term,CNN-LSTM)、長短期記憶-卷積神經(jīng)網(wǎng)絡(luò)(long short-term memory-fully convolutional network,LSTM-FCN),本文研究直接從原始EEG時(shí)間序列中提取時(shí)域信息和頻域信息,采用CNN-LSTMs獲取腦電空間連續(xù)信息與時(shí)間依賴信息。圖5和圖6為不同認(rèn)知負(fù)荷水平下的EEG腦電時(shí)域、頻域特征圖。圖7中EEG的時(shí)頻域信息時(shí)空特征明顯,所以本文研究選擇了圖片分類的神經(jīng)網(wǎng)絡(luò)進(jìn)行認(rèn)知負(fù)荷分類。

圖5 不同認(rèn)知負(fù)荷水平下的EEG時(shí)域特征圖Fig.5 Time-domain feature map of EEG under different cognitive load levels

圖6 不同認(rèn)知負(fù)荷水平下的EEG頻域特征圖Fig.6 Frequency-domain feature map of EEG under different cognitive load levels

Time為時(shí)長;ERSP為事件相關(guān)譜攝動(dòng)
2.1.2 心電數(shù)據(jù)提取
一個(gè)心搏周期內(nèi)的心電信號(hào)主要包含下列3個(gè)典型的波形。P波、QRS波群、T波。表現(xiàn)為一段波形圓鈍的正向起伏,占時(shí)較長,可以達(dá)到0.05~0.25 s。
用于R波檢測(cè)的方法有很多,例如基于數(shù)學(xué)形態(tài)學(xué)的方法、匹配濾波方法、過零檢測(cè)方法等,其中,基于閾值的差分法是一種較為常用的經(jīng)典算法。其基本原理是,檢測(cè)波形斜率的變化來定位尖峰位置。R波在心電波形中表現(xiàn)為明顯的突變沖激,通過差分方法計(jì)算波形對(duì)時(shí)間的導(dǎo)數(shù)值,若超過特定閾值,則視為此處斜率變化較大,可能處于R波的上升沿或下降沿,R波點(diǎn)可能位于附近的極值點(diǎn)上。
2.1.3 注視點(diǎn)數(shù)據(jù)提取
本文研究采取一種基于位置閾值算法的注視點(diǎn)提取方法。其總體思想是將時(shí)序上相鄰兩視點(diǎn)的位置差與給定閾值進(jìn)行比較,小于閾值,則認(rèn)為這兩個(gè)視點(diǎn)位置足夠靠近,可以視為屬于同一個(gè)注視點(diǎn)所代表的注視域;如果大于閾值,則認(rèn)為這兩個(gè)視點(diǎn)分屬于兩個(gè)注視域。
步驟1將輸入的二維平面直角坐標(biāo)系下視點(diǎn)位置坐標(biāo)記為集合{x(i),y(i)},逐次計(jì)算相鄰視點(diǎn)的位置差,得到差值集合dgaze,計(jì)算過程為
(13)
步驟2提取數(shù)值大于100像素的差值點(diǎn)dgaze(k)。該差值所對(duì)應(yīng)的兩個(gè)相鄰視點(diǎn)分別屬于前一個(gè)注視域和后一個(gè)注視域。將這兩個(gè)視點(diǎn)分別記為n(k)和n(k+1)。
n(k)=[x(k),y(k)]
(14)
n(k+1)=[x(k+1),y(k+1)]
(15)
步驟3如果視點(diǎn)n(i)在時(shí)域上距離較近,表現(xiàn)為相鄰或臨近的位置差值連續(xù)大于閾值,則將其視為掃視路徑上的點(diǎn),從注視域點(diǎn)集中剔除。本文選取的時(shí)序閾值為采樣周期的4倍,即,如果n(k+1)與n(k)之間少于4個(gè)采樣點(diǎn),則認(rèn)為n(k+1)為掃視點(diǎn),不屬于任何注視域。經(jīng)過篩選后,獲得注視域點(diǎn)集ψi。
ψi={n(i-1)+1,…,n(i)}
(16)
步驟4計(jì)算注視域ψ的中心點(diǎn),作為代表該注視域的注視點(diǎn)。根據(jù)得到的注視點(diǎn),可以得到注視點(diǎn)個(gè)數(shù)和平均注視時(shí)間作為眼動(dòng)數(shù)據(jù)的特征指標(biāo)。
除了注視點(diǎn)信息,還采取了瞳孔數(shù)據(jù)作為特征信息,計(jì)算了瞳孔直徑均值和瞳孔直徑標(biāo)準(zhǔn)差作為眼動(dòng)數(shù)據(jù)的特征。
經(jīng)過前文所述的處理過程,從采集到的多來源、多模態(tài)生理數(shù)據(jù)中提取出的特征集如表1所示。

表1 生理數(shù)據(jù)特征指標(biāo)Table 1 Physiological data features
可以看到,該特征集共包含34項(xiàng)特征指標(biāo),即34維原始特征維度。從維數(shù)的角度看,并不構(gòu)成典型的高維小樣本數(shù)據(jù)集,理論上可以直接作為機(jī)器學(xué)習(xí)算法的輸入變量。但從實(shí)際應(yīng)用的角度出發(fā),依舊需要對(duì)其進(jìn)行進(jìn)一步的處理,去掉不相關(guān)特征和冗余特征,對(duì)特征集進(jìn)行約簡降維 (將高維數(shù)據(jù)通過矩陣變換映射到更低維空間)。
特征降維主要有兩個(gè)處理思路,特征提取和特征選擇。特征提取一般是通過數(shù)學(xué)計(jì)算將數(shù)據(jù)映射至另一維度空間,典型的方法有主成分分析法、獨(dú)立成分分析法、Fisher線性判別分析法等。某些生理信號(hào)具有數(shù)值意義之外的時(shí)間、空間特征,但是特征提取改變了原來的特征空間,所產(chǎn)生的新特征具備與原始特征差距甚遠(yuǎn)、甚至完全不同的物理意義,造成了其數(shù)據(jù)含義的不可解釋性,這是生理數(shù)據(jù)研究中難以接受的[15-18]。
特征選擇的核心思想是通過某種評(píng)價(jià)準(zhǔn)則,從原始特征空間中選擇最優(yōu)特征子集。常見的評(píng)價(jià)標(biāo)準(zhǔn)有發(fā)散性(如信息熵等)或相關(guān)性(如單特征與響應(yīng)變量之間的線性相關(guān)性等)、目標(biāo)函數(shù)(如學(xué)習(xí)效果評(píng)價(jià)指標(biāo))等[19]。
針對(duì)上文描述的腦力負(fù)荷預(yù)測(cè)模型,選擇回歸模型的均方誤差(mean squared error,MSE)做為評(píng)價(jià)指標(biāo),對(duì)特征選擇和模型調(diào)參的過程進(jìn)行優(yōu)化,即要求最優(yōu)特征子集和模型參數(shù)使得模型的均方誤差最小。MSE的計(jì)算公式為
(17)
式(17)中:yi為測(cè)試樣本的實(shí)際值;f(xi)為模型預(yù)測(cè)值。
為了能夠讓模型更好地解決實(shí)際中的問題,將訓(xùn)練好的模型部署到真實(shí)的環(huán)境中時(shí),在真實(shí)的數(shù)據(jù)上得到最好的預(yù)測(cè)效果,誤差越小越好。但是在實(shí)際問題中很難通過直接將泛化誤差作為了解模型泛化能力的信號(hào),因?yàn)樵诓渴瓠h(huán)境和訓(xùn)練模型之間往復(fù),代價(jià)很高,也不能使用模型對(duì)訓(xùn)練數(shù)據(jù)集的擬合程度來作為了解模型泛化能力的信號(hào),因?yàn)楂@得的數(shù)據(jù)往往含有不需要的信息。因此在本文研究中將數(shù)據(jù)分割成兩部分:80%的樣本作為訓(xùn)練集、剩余20%的樣本作為測(cè)試集。使用訓(xùn)練集的數(shù)據(jù)來訓(xùn)練模型,然后用測(cè)試集上的誤差作為最終模型在應(yīng)對(duì)現(xiàn)實(shí)場(chǎng)景中的泛化誤差。
在上述模型優(yōu)化的過程中,模型中有一些超參數(shù)和具體的輸入特征需要根據(jù)具體問題進(jìn)行實(shí)際調(diào)整。通過不斷調(diào)整算法的超參數(shù),模型在測(cè)試集上的預(yù)測(cè)能力可以不斷增強(qiáng)。但在實(shí)際問題中,由于訓(xùn)練數(shù)據(jù)過多,超參數(shù)維度過多,人工調(diào)整參數(shù)有著巨大的成本壓力。因此,提出以 SVM 為核心算法,通過 PSO 算法對(duì)模型超參數(shù)進(jìn)行自動(dòng)調(diào)整。通過對(duì) MSE 指標(biāo)的不斷觀測(cè),PSO 能夠逐漸收斂到模型的最佳參數(shù)。具體的參數(shù)如下。
(1) SVM 算法的懲罰系數(shù)C。在 SVM 模型中,C的大小控制著優(yōu)化目標(biāo)對(duì)損失函數(shù)的要求。C越大,越要求松弛變量值趨近于0,即要求處于間隔帶之外的樣本盡可能減少。在這種情況下,模型對(duì)訓(xùn)練樣本的擬合度較高,但無法保證對(duì)訓(xùn)練樣本集以外的數(shù)據(jù)的預(yù)測(cè)效果,即產(chǎn)生過擬合現(xiàn)象,進(jìn)而導(dǎo)致模型的泛化能力減弱。C越小,對(duì)落在間隔帶之外的樣本的容忍度越高,對(duì)訓(xùn)練集的擬合性下降,可能導(dǎo)致欠擬合;但另一方面,對(duì)新數(shù)據(jù)的容錯(cuò)能力增強(qiáng),提高了模型的泛化性。
(2)核函數(shù)系數(shù)γ。γ決定著核函數(shù)的曲線形態(tài),越大,映射后的各樣本點(diǎn)之間的距離越趨向于相等,空間分布越疏散,每個(gè)樣本點(diǎn)都可能被視為一個(gè)單獨(dú)的聚類,導(dǎo)致過擬合;越小,映射后得到的樣本點(diǎn)之間距離越小,在高維空間中的分布越集中,所有樣本點(diǎn)都可能被視為隸屬于同一個(gè)聚類,造成欠擬合。
(3)特征輸入選擇。上文提到輸入的34個(gè)特征可能存在無關(guān)特征或者冗余特征,在本文研究中將特征是否進(jìn)入模型作為一個(gè)二元變量進(jìn)行優(yōu)化,直接作用到最后的損失函數(shù)。但是直接對(duì)所有特征進(jìn)行二元選擇,可行解空間可以達(dá)到234。因此將所有特征分為 3 組,第二組的腦電信號(hào)特征中每一組作為一個(gè)備選,大大降低了可行解空間。以心電信號(hào)為例,將從心電信號(hào)中提取出的特征指標(biāo)組成一個(gè)特征向量,記為φECG,集合內(nèi)共包括12個(gè)特征元素。
φECG={f(1),f(2),…,f(12)}
(18)
用一個(gè)12位二進(jìn)制數(shù)FECG表示由φECG中各元素所組成的特征子集,即
(19)
(20)
不同的特征被選中或未選中,FECG的值會(huì)相應(yīng)改變。例如,若只選中心電信號(hào)的第一個(gè)特征指標(biāo)SDNN,其他特征均被排除,則FECG=1;若只選中第二個(gè)特征指標(biāo)rMSSD,則FECG=2;若選中第一個(gè)和第二個(gè)特征指標(biāo),其他特征均未選中,則FECG=3。
綜上所述,聯(lián)合優(yōu)化的數(shù)學(xué)模型為
min{MSE}
(21)
(22)
以上為腦力負(fù)荷預(yù)測(cè)模型的優(yōu)化模型,為了驗(yàn)證聯(lián)合優(yōu)化模型的有效性,將對(duì)比 SVM 模型與聯(lián)合優(yōu)化模型的結(jié)果,以說明聯(lián)合優(yōu)化模型的擬合效果相對(duì)于簡單的 SVM 模型有進(jìn)一步的提升。
首先在原始特征集輸入的情況下,對(duì)SVM參數(shù)進(jìn)行調(diào)整,以得到 SVM 模型的最佳算法效果。上文中已經(jīng)說明SVM 模型有兩個(gè)參數(shù)需要調(diào)整C、γ,通過對(duì)這兩個(gè)參數(shù)進(jìn)行調(diào)整可以達(dá)到算法的最佳效果。具體的調(diào)整方法如下。
(1)將C固定為100,γ分別取值0.01、0.05、0.1。為了更清晰地比較3個(gè)γ值對(duì)SVM效果的影響,將3個(gè)模型在測(cè)試集上的回歸評(píng)價(jià)指標(biāo)繪制為柱狀圖的形式,如圖8所示。

圖8 回歸結(jié)果評(píng)價(jià)指標(biāo)Fig.8 regression Results with different γ and C
(2)將γ固定為0.05,C分別取值10、100、1 000。訓(xùn)練得到的支持向量回歸模型在測(cè)試數(shù)據(jù)集上的預(yù)測(cè)效果如圖8所示。
在圖8中,MAE指的是平均絕對(duì)誤差(mean absolute error,MAE)。R2即R2指標(biāo),該指標(biāo)衡量了不同背景下回歸模型的預(yù)測(cè)性能,其值越大、越趨近于1時(shí),代表模型的性能越好。
從圖8可以看到,γ=0.05時(shí),預(yù)測(cè)模型的MAE和MSE值均為3組間最小,R2為最大。因此,在C一定的條件下,使得SVM模型最優(yōu)的γ值落在0.01~0.1的范圍內(nèi)。
從圖8可以看到,C=100時(shí),預(yù)測(cè)模型的MAE和MSE值均為3組間最小,R2為最大。因此在γ值一定的條件下,使得SVM模型最優(yōu)的C值落在10~1 000的范圍內(nèi)。
從以上模型優(yōu)化結(jié)果可以看到,C=100并且γ=0.05時(shí),SVM模型的效果達(dá)到最優(yōu),此時(shí)模型的誤差指標(biāo)如表2所示。

表2 誤差指標(biāo)(SVM模型)Table 2 Error indicators of SVM model
采用粒子群算法對(duì)上述聯(lián)合優(yōu)化問題進(jìn)行求解,并和SVM 模型結(jié)果進(jìn)行對(duì)比。聯(lián)合優(yōu)化的迭代過程如圖9所示。可以看到,在100次迭代內(nèi),SVM模型的均方誤差達(dá)到了8.930 2,與圖8中所示模型的MSE相比,經(jīng)過聯(lián)合優(yōu)化的模型有了顯著的改善。

圖9 聯(lián)合優(yōu)化模型迭代過程Fig.9 Iterative process of joint optimization
將聯(lián)合優(yōu)化后的模型在測(cè)試數(shù)據(jù)集上進(jìn)行預(yù)測(cè),所得到的誤差指標(biāo)數(shù)據(jù)如表3所示,并和3.2節(jié)中的SVM模型進(jìn)行比較。可以看到,與SVM模型相比,聯(lián)合優(yōu)化模型的模型評(píng)價(jià)指標(biāo)均得到了提升。以3.1節(jié)中預(yù)測(cè)效果相對(duì)最好的模型(C=100,γ=0.05) 為例,經(jīng)過聯(lián)合優(yōu)化,SVM模型的MAE從2.86降至1.30;R2從0.81增至0.96,更接近于數(shù)值1,得到一定程度的提升;MSE從22.11降至5.17,得到顯著改善。因此,可以認(rèn)為聯(lián)合優(yōu)化算法對(duì)SVM模型的學(xué)習(xí)過程和學(xué)習(xí)效果具有明顯的優(yōu)化效果。

表3 誤差指標(biāo)(聯(lián)合優(yōu)化和SVM模型)Table 3 Error indicators of joint optimization model and SVM model
為了更直觀地展示聯(lián)合優(yōu)化模型的預(yù)測(cè)效果,以測(cè)試數(shù)據(jù)集的實(shí)際值為自變量,聯(lián)合優(yōu)化SVM模型的預(yù)測(cè)值為因變量,繪制回歸結(jié)果圖。如圖10所示。

圖10 回歸結(jié)果 (聯(lián)合優(yōu)化)Fig.10 Regression results graph with joint optimization
從圖10中所設(shè)虛線為y=x直線可以看到,大多數(shù)樣本點(diǎn)落在45°輔助線附近或輔助線上,表明這些樣本的實(shí)際值與預(yù)測(cè)值趨近于相等,具備較好的擬合狀態(tài)。同時(shí),該模型依然存在與實(shí)際值相差較大的預(yù)測(cè)值,表現(xiàn)在回歸結(jié)果圖中即為遠(yuǎn)離y=x輔助線的樣本點(diǎn),可以看到,圖10中存在數(shù)個(gè)偏離程度較大樣本點(diǎn),這也是表2中所示的模型誤差指標(biāo)的來源。
除上述基本圖形特征外,還注意到,在50~60的實(shí)際值范圍內(nèi),樣本點(diǎn)的分布呈現(xiàn)稀疏松散的狀態(tài),與45°線均存在一定的偏離,且隨著實(shí)際值的增加,這種松散和偏離的趨勢(shì)存在加劇的傾向。這可能是由于以下原因造成的:無論是用于訓(xùn)練的樣本集或是用于測(cè)試的樣本集,落在這一取值區(qū)間內(nèi)的數(shù)據(jù)均較為稀少,模型在訓(xùn)練過程中很難從有限的樣本中學(xué)習(xí)到足夠的特征,在預(yù)測(cè)過程中就會(huì)出現(xiàn)相對(duì)較大的誤差。
通過基于生理數(shù)據(jù)的調(diào)度員認(rèn)知決策結(jié)構(gòu)模型構(gòu)建,實(shí)驗(yàn)室內(nèi)部自行開發(fā)的調(diào)度指揮一體化仿真實(shí)驗(yàn)平臺(tái),使用多種生理測(cè)量儀器采集調(diào)度人員在應(yīng)急場(chǎng)景處置過程中的生理信號(hào)。對(duì)多源異構(gòu)生理信號(hào)進(jìn)行結(jié)構(gòu)化處理,提取其特征指標(biāo),利用支持向量回歸模型進(jìn)行初步的回歸預(yù)測(cè);設(shè)計(jì)并采用了一種基于特征選擇和SVM參數(shù)選擇聯(lián)合優(yōu)化的粒子群算法對(duì)支持向量回歸模型的訓(xùn)練過程進(jìn)行優(yōu)化。相比于SVM 模型,聯(lián)合優(yōu)化模型能夠自動(dòng)化的調(diào)整參數(shù)和選擇特征,并且在測(cè)試數(shù)據(jù)集上,聯(lián)合模型相對(duì)于SVM模型,MSE 誤差指標(biāo)減少了 77%,R2誤差指標(biāo)提升了 15%。同時(shí)在使用聯(lián)合優(yōu)化模型擬合結(jié)構(gòu)方程過程中,腦力負(fù)荷與注意力、工作記憶之間的顯著性P值從 0.09 降低到了 0.02,這表明該理論模型與實(shí)際采集到的樣本數(shù)據(jù)之間具有較好的適配度,模型具有較高的接受度和可信度。基于實(shí)驗(yàn)和機(jī)器學(xué)習(xí)算法提取出結(jié)構(gòu)方程模型所需的樣本數(shù)據(jù)后,對(duì)結(jié)構(gòu)方程模型進(jìn)行擬合及修正,獲得具有量化路徑系數(shù)的認(rèn)知決策模型。以實(shí)際北京局調(diào)度員試驗(yàn)數(shù)據(jù)作為樣本,通過實(shí)驗(yàn)與比較,驗(yàn)證揭示了調(diào)度員認(rèn)知要素與認(rèn)知決策過程之間的基本作用關(guān)系,研究了腦力負(fù)荷與注意力和工作記憶之間的關(guān)系,對(duì)后期調(diào)度員工作負(fù)荷及適崗能力優(yōu)化更具實(shí)用價(jià)值。