秦 倩,丁新偉,邢志偉,凌若鴻
(1. 首都機場集團有限公司國際科技部,北京 100621;2. 中國民航大學電子信息與自動化學院,天津 300300)
隨著國民生活水平的不斷提升,越來越多的旅客選擇飛機作為出行工具,由2020年6月中國民航局發布的統計公報可知去年民航完成旅客運輸13.52億人次,同比增長6.9%。運輸量的增長必然為民航服務質量帶來巨大挑戰。航站樓旅客安檢服務效率作為旅客出港流程中機場服務質量的集中體現,有效分析研究隊列狀態變化對在不改變原先機場空間布局的基礎上提高運行效率及旅客滿意度至關重要,能夠在一定程度上為機場控制提供決策依據,從而實現整個機場的安全高效運行。
國內外學者對行人在不同場景中的排隊行為與規律進行了各方面的研究[1-2]。文獻[3-5]通過對安檢排隊系統進行特征分析,利用排隊理論建立安檢排隊模型,優化安檢通道數量配置、提高安檢運行效率提供理論依據與決策支持;文獻[6-8]通過研究場景空間特點構建隊列模型,為服務系統的資源配置和優化提供思路;文獻[9-11]分別根據數據經驗分布、服務水平標準設定以及Logit-SUE模型構建合適的隊列模型,由此對排隊現象進行定量分析,取得了較好的效果。子空間辨識作為系統辨識的重要分支,引起了大量控制領域專家學者的注意[12-15]。文獻[16]提出一種基于Laguerre濾波器的核范數子空間辨識方法,針對連續時間隨機系統辨識有較高的有效性和精確性;文獻[17,18]考慮方法中模型定階問題,對構建低秩矩陣逼近的秩最小化問題進行相關研究。
目前子空間辨識多用于工業過程辨識,在機場等場景中的應用較少。對排隊行為研究的主要方法都集中在排隊論和社會力模型上,且對于具體模型構造仍處于起步階段。航站樓中拓撲結構和業務類型異常復雜,這其中的安檢過程的高效有序是旅客滿意度的重要決定性因素。在系統性分析航站樓安檢服務的影響因素的基礎上,基于子空間辨識方法構建了旅客安檢服務模型,并分析優化模型和傳統模型的結果差異,為航站樓旅客出港排隊流程的仿真提供了新方法,為安檢狀態辨識提供符合實際運行情況的參考。
傳統的旅客安檢隊列模型構建方法難以對安檢旅客服務資源的運行指揮提供十分精準數據支持,且離港旅客安檢服務環節的復雜性等一系列問題致使其成為了旅客排隊滯留的重災區。因此,如何設計精準有效的旅客安檢隊列模型成為了提升航站樓內安檢運行效率的研究重點。旅客值機結束后下一步到達安檢區排隊等候接受安檢服務,具體安檢流程如圖1所示。

圖1 航站樓安檢服務流程
航站樓安檢的主要屬性包括旅客到達數量、旅客所屬航班號、旅客所屬航班計劃起飛時間、旅客性別、旅客值機托運行李數量、安檢通道開放數、安檢時間、安檢班組等。在實際運行中,這些屬性具有不穩定性,提高了安檢狀態辨識難度。為設計精準有效的旅客安檢隊列模型,研究基于子空間辨識方法的安檢狀態預測,在篩選出合適有效的安檢屬性后,根據安檢旅客到達流量特征將數據進行分組,并對每組數據分別構建安檢狀態預測模型。
航站樓安檢隊列狀態受旅客到達數量、安檢口開放數量等因素影響,且在實際運行中,這些因素具有不確定性,加大了隊列狀態預測的難度。主要影響因素分析如下:
1)安檢旅客到達數量
因數據量較大,同時在機場繁忙時段,機場會呈現多樣性與復雜性,因此這里選取繁忙時段數據做代表分析。對國內某大型機場于2019年度繁忙時段9:00-11:00所有前往安檢項目的旅客數據進行整理與分析,獲取時間段內每分鐘安檢旅客到達均值如圖2所示。繁忙時段旅客到達數量與同時段航班數量相關,存在少數峰值,此時為安檢系統壓力最大時段。

圖2 9:00-11:00每分鐘安檢旅客到達均值折線圖
安檢旅客到達數量作為航站樓安檢場景的重要因素,在實際運行中具有周期性,流量特征較為明顯,可清晰建立歷史流量日歷。使用無監督聚類對安檢流量歷史數據做處理以挖掘其中規律,目標是為保證同一分類的數據盡可能相似而非相異。再使用SVM(支持向量回歸機)分類算法將數據根據特征完成分類,從而預測出某個時間的流量曲線。
2)安檢通道開放數量
機場在不同時段內根據所承受的安檢壓力決定開放的安檢通道數量,通過控制安檢通道數量開放以保證機場的高效運行。國內大型樞紐航站樓安檢通道通常在兩邊各設置一個安檢服務,可在同一時間對單通道內兩名旅客進行安檢,在飽和狀態下甚至可開放資源在同一時間對四名旅客進行安檢,以保證繁忙時段安檢環節的高效運行。據調研,數據來源機場單個安檢通道僅會設定兩個安檢服務,因此不考慮其它多服務情況。
3)旅客安檢狀態
由于旅客個人的行程計劃安排,攜帶的行李數量有一定差別,由此將決定旅客是否需要辦理行李托運。通過對旅客是否辦理行李托運和安檢效率的分析可知,前去柜臺并辦理值機托運行李的旅客在通過安檢時攜帶隨身物件更少,安檢通過時長更短。
對于各個樣本,對旅客是否辦理行李托運以及托運數量有詳細的記錄,將已辦理行李托運的旅客記為1,未辦理行李托運的旅客記為0,以此計算每分鐘未辦理行李托運的旅客比例。該比例在一定程度上決定該時間段安檢隊列狀態。
4)其它因素
機場實際運行中,安檢場景可能出現諸多不確定因素,如行李開包檢查、旅客不配合安檢工作甚至擾亂安檢工作等情況的出現,將極大影響當前安檢通道的安檢效率,進而影響整體安檢隊列狀態。
安檢場景作為航站樓內典型的隊列場景之一,在實際運行過程中,其基本目標是在不同條件下保持安檢輸入量和安檢輸出量差值穩定在一定范圍內,達到安檢系統高效率運行的目的,保證航站樓整個大系統有條不紊的高效率運行。
子空間辨識方法的主要特點在于直接由輸入輸出數據辨識系統的狀態空間模型,適用于多變量系統辨識,且不需要參數化與迭代優化,僅依靠線性代數方法實現。因此考慮到子空間辨識方法的特點,適用于所討論的航站樓安檢場景。但航站樓安檢場景系統較為復雜,隨機場繁忙度呈現不同特性,是隨時間變化而具有不同特征的非線性系統,但子空間辨識方法更適用于線性度較佳的系統,在系統穩定波動較大時各指標會有不同程度的下降。為改善這種現狀,結合航站樓安檢系統特性,基于大量歷史數據對安檢流量進行特征分析完成分類,根據不同安檢狀態分別建模以保證準確性,完成對航站樓安檢場景的子空間辨識。
航站樓安檢過程的輸入數據和輸出數據均可從歷史數據庫中得出。系統的狀態空間表達式如下[19]
xk+1=Axk+Buk+wk
(1)
yk=Cxk+Duk+vk
(2)
滿足

(3)
式中,xk∈Rn,uk∈Rm和yk∈Rl分別為系統在k時刻的過程狀態向量、輸入觀測向量和輸出觀測向量;vk∈Rl和wk∈Rn均為系統的不可測噪聲信號,vk為輸出測量噪聲,wk為系統的過程測量噪聲;A,B,C,D為系統矩陣;E為期望算子;σpq表示當p=q時σpq=0,當p≠q時σpq=1;系統中各個矩陣已設定相應的維數。
在確定系統的輸入輸出后,可確定系統的狀態空間矩陣。為此,需要構建輸入輸出數據給定值的Hankel矩陣,并確定模型階次,計算所需系統矩陣A,B,C,D。根據航站樓安檢場景和數據,將安檢旅客到達數、安檢通道開放數和旅客安檢狀態作為輸入,旅客安檢平均等待時間、安檢隊列平均長度作為輸出,構建一個三輸入二輸出的多輸入多輸出(multiple input multiple output,MIMO)系統。
子空間辨識方法基于輸入觀測向量ut∈Rm和輸出觀測向量yt∈Rl,為確定模型階次n和獲取系統矩陣,將數據進行處理構成所需Hankle矩陣
(4)

(5)

(6)

(7)
Up和Uf分別表示數據庫中設定的過去時刻和未來時刻的輸入觀測向量,同理Yp和Yf。此外為保證模型的準確性,p和f在適應系統參數的前提下應適當選取為大于系統階次的參數,以降低對噪聲的敏感度。由此可得Hankel形式狀態空間表達式
(8)
其中,廣義能觀矩陣
三角Toeplitz矩陣
低維分塊三角Toeplitz矩陣
子空間方法主要包括N4SID、MOESP和CVA,三種方法的區別僅在于權重矩陣的選取方式不同[20]。對比實驗可知,在當前場景下N4SID誤差相對較大,而CVA和MOESP相對較好,但MOESP的加權方式運算量相對于CVA更小,因此本文采用MOESP方法,對獲得的狀態空間表達式使用斜向投影后,在投影左右加權,消除噪聲和未來輸入Uf后即可得到
Om=W1Γmm
(9)

(10)
由此可獲得系統的階數n即為上式中非零奇異值的個數。再利用廣義能觀矩陣Γm和狀態估計序列m,通過最小二乘法即可計算出系統矩陣A,B,C,D。
航站樓安檢場景在非空閑狀態下有隊列長度不為0的特性。結合這一特點,對子空間辨識方法進行改進,構建額外的“初始隊列狀態”,以提高子空間辨識方法和安檢場景的契合度。在歷史數據的指導下提高預測精確度,式(2)修改為
yk=Cxk+Duk+vk+dk
(11)
其中dk為初始隊列狀態,包括初始隊列長度和初始等待時間。機場9:30-11:00的歷史隊列長度變化和歷史等待時間變化如圖3所示。

圖3 9:30-11:00歷史隊列狀態
隊列長度和等待時間相關性較強,且基本呈正相關關系。等待時間變化的波動幅度比隊列長度較大,總體曲線特征明顯。通過對歷史數據的分析,獲取各時段規律,可獲取在一定時間同特征下安檢場景的隊列長度常態值和等待時間常態值,由此完成對初始隊列狀態的設定。
在對一段時間的安檢狀態進行辨識預測時,根據起始時間從庫中獲取對應的初始隊列狀態,以此為基礎對未來隊列狀態進行預測,解決子空間方法初始誤差問題,避免因隊列初始狀態差異較大而導致的預測精度較差問題。
改進后的子空間辨識方法求解安檢隊列狀態模型步驟如圖4所示。

圖4 子空間辨識方法求解流程圖
數據來源于國內某樞紐機場部署的機場協同決策系統中的航站樓安檢共享數據,數據樣例如表1所示,包含航班號、安檢通道、安檢時間、安檢模式和所屬航班的計飛實飛情況等。近年來這些豐富的歷史數據,為從不同的角度挖掘旅客安檢情況提供了強有力的數據支撐。

表1 旅客安檢與所屬航班數據樣例
結合該機場某航段的實際運行數據分析各因素對航站樓安檢過程的影響,介紹詳細的分析過程。在航站樓安檢的各影響因素中,安檢旅客的到達情況、旅客安檢時間和旅客安檢狀態是構建具體模型的重要支撐和入手點。因此對數據的預處理過程如下:
1)刪除VIP通道旅客數據。安檢旅客數據中包括少量VIP通道旅客,VIP通道為額外安檢通道,通過旅客較少,較少存在排隊現象。不會對其它隊列長度產生影響;
2)刪除安檢時間、安檢通道等關鍵字段存在空值的旅客記錄;
3)結合機場繁忙度設定對安檢數據做批處理,并對歷史數據進行訓練獲取流量特征,并根據特征將數據分類。
在影響因素分析中可知,安檢旅客到達數量是影響安檢隊列狀態的主要因素之一。由于在實際運行中,不同時間段的旅客流量特征差距很大,因此,將安檢狀態按照繁忙時間段特征分組,使得組內時間段旅客到達數量特征相似,并分別構建各個分組的安檢隊列狀態模型。
對機場2019年的安檢旅客流量進行分析,獲取的年度平均每半小時安檢旅客數量如圖5所示。由圖可知:6:00~9:00安檢旅客流量波動較大,并在臨近9:00時呈現上升趨勢;9:00~12:00和15:30~19:00為安檢高峰期,旅客流量較大;12:00~15:30期間安旅客流量相對平穩,并于臨近15:30時安檢旅客流量呈現上升趨勢并再次達到高峰狀態;23:00至次日6:00期間安檢旅客流量較小,一般不會發生安檢資源緊張的情況。

圖5 每半小時平均安檢旅客數量
根據機場繁忙度設定將23:00~6:00定義為空閑狀態,將6:00~9:00、12:00~15:30和19:00~22:00定義為一般繁忙狀態,將9:00~12:00和15:30~19:00定義為繁忙狀態。由于夜間航班流量較小,離港旅客流量也因此較小,不存在安檢資源緊張的情況,因此,只探討繁忙和一般繁忙狀態的安檢狀態辨識問題。
結合所用方法的特性,根據特征再將數據分為高峰趨近t1、高峰遠離t2、次高峰趨近t3、次高峰遠離t4四種類型,分別辨識建模以保證模型準確性和適用性。
以每分鐘安檢旅客到達均值、安檢通道開放數、未辦理行李托運旅客比例作為輸入,每分鐘平均隊列長度和旅客平均等待時間為輸出,構建一個三輸入二輸出的MIMO系統。取連續時段的60組數據作為測試集,余下的作為訓練集。在此以高峰-趨近時段為例,子空間MOESP辨識方法獲取的航站樓安檢高峰-趨近時段系數矩陣如下

為說明方法的有效性,分別采用以下未分組子空間MOESP方法和支持向量回歸(SVR)與之進行對比實驗。圖6和圖7分別為3種方法的隊列長度和等待時間預測結果對比。

圖6 平均隊列長度

圖7 平均等待時間
對于預測結果的誤差評價,使用平均絕對誤差(MAE),平均絕對百分誤差(MAPE)來衡量模型的預測效果,隊列長度誤差取± 3人,等待時間誤差取± 60秒。表2、3、4分別給出了各組實驗的預測準確率和MAE及MAPE對比。
由表2可知,分組子空間方法對于隊列長度和等待時間的預測準確率在各個特征段均優于未分組子空間方法和SVR方法,其中預測效果最好的為次高峰-趨近時段,達到了84.44%。未分組子空間算法在復雜非線性系統中適應性較差,難以對各個時段特征變化的安檢場景完成準確預測;SVR方法所需的支持向量個數較多,在使用數據量較大的支持向量訓練模型耗時較長,且在安檢場景中預測效果相對較差。
由表3、表4可知,分組子空間方法的MAE和MAPE明顯優于其它兩種模型,說明分組子空間方法預測模型具有更小的誤差波動,并且預測模型更加穩定。因此,分組子空間方法所獲取的模型的預測性能明顯優于其它兩種模型。利用該模型對航站樓安檢進行預測,能夠獲取更準確的隊列狀態,并及時對場景資源進行判斷,一定程度提高安檢資源調控響應速度,減少安檢隊列過長、旅客等待時間過長等問題的出現的可能。

表3 平均隊列長度MAE和MAPE對比

表4 平均等待時間MAE和MAPE對比
研究了航站樓安檢隊列狀態預測問題,以提高預測準確率為目標,并提出基于子空間算法的安檢隊列狀態預測模型,具體包括如下幾個方面:1)構建了基于子空間方法的航站樓安檢隊列狀態預測模型,使用國內某大型機場安檢數據對模型進行訓練與檢驗,取得了良好的效果;2)根據安檢旅客到達流量特征和繁忙度設定將數據分組,分別構建不同特征數據下的預測模型,提高了預測準確率;3)將該方法和未分組子空間方法、SVR方法預測進行對比,該方法的準確率和穩定性均為更優效果。
目前,將子空間辨識方法應用于機場系統的研究較少,將子空間辨識方法應用于航站樓安檢場景,為后續的安檢資源優化設計提供了重要思路。