魏然之 吳 杰 王 森
(1.上海地鐵維護(hù)保障有限公司通號(hào)分公司, 200235, 上海;2.上海申通地鐵集團(tuán)有限公司技術(shù)中心, 201103, 上海∥第一作者, 工程師)
隨著民用通信網(wǎng)絡(luò)在國(guó)內(nèi)城市軌道交通領(lǐng)域的大規(guī)模部署,4G(第四代移動(dòng)通信技術(shù))/5G(第五代移動(dòng)通信技術(shù))無(wú)線(xiàn)信號(hào)實(shí)現(xiàn)了城市軌道交通線(xiàn)路地下區(qū)段的全覆蓋。考慮到目前衛(wèi)星定位技術(shù)在地下空間應(yīng)用時(shí)具有局限性,采用無(wú)線(xiàn)信號(hào)在地下線(xiàn)路區(qū)段為列車(chē)提供輔助的定位信息,具有一定的可行性和應(yīng)用空間。
城市軌道交通中的列車(chē)定位功能通常由信號(hào)系統(tǒng)負(fù)責(zé),通過(guò)安裝在軌旁和列車(chē)上的定位設(shè)備把列車(chē)位置傳送給ATS(列車(chē)自動(dòng)監(jiān)控)系統(tǒng)。隨著信號(hào)系統(tǒng)的更新迭代,軌旁定位設(shè)備持續(xù)升級(jí),從傳統(tǒng)的軌道電路到計(jì)軸,再到目前基于無(wú)線(xiàn)的車(chē)地通信,由此列車(chē)定位信息也越來(lái)越精確。但在信號(hào)系統(tǒng)發(fā)生故障、列車(chē)采用降級(jí)模式運(yùn)行的情況下,僅靠軌道電路或計(jì)軸只能將列車(chē)定位在某個(gè)軌道區(qū)段內(nèi),其定位信息的精確度大幅下降。為此,本文基于地下區(qū)間民用通信系統(tǒng)無(wú)線(xiàn)信號(hào)的應(yīng)用實(shí)際,提出了無(wú)線(xiàn)信號(hào)指紋定位算法,建立了列車(chē)定位模型,將該算法用于上海軌道交通9號(hào)線(xiàn)地下段現(xiàn)場(chǎng)測(cè)試,并對(duì)測(cè)試結(jié)果進(jìn)行分析驗(yàn)證。
本文針對(duì)地下線(xiàn)路場(chǎng)景下列車(chē)定位的研究從兩個(gè)角度展開(kāi):
1) 建立列車(chē)輔助定位模型:主要從數(shù)據(jù)采集、特征分析和AI(人工智能)建模等環(huán)節(jié)逐步建立仿真模型,通過(guò)4G/5G通信網(wǎng)絡(luò)數(shù)據(jù)實(shí)現(xiàn)對(duì)列車(chē)所在位置的預(yù)測(cè)和輸出。
2) 列車(chē)定位精度的分析:基于所建模型對(duì)影響列車(chē)定位精度的主要因素進(jìn)行細(xì)化,并進(jìn)行對(duì)比分析,為提升列車(chē)定位精度提出有針對(duì)性的建議。
圖1為列車(chē)輔助定位模型的數(shù)據(jù)流處置流程。

圖1 列車(chē)輔助定位模型數(shù)據(jù)流示意圖
本研究采用無(wú)線(xiàn)信號(hào)指紋定位算法作為城市軌道交通列車(chē)輔助定位模型的核心算法,將信號(hào)系統(tǒng)中ATS的列車(chē)位置信息作為該算法的標(biāo)簽數(shù)據(jù)。
無(wú)線(xiàn)信號(hào)指紋定位算法擬通過(guò)AI模型學(xué)習(xí)方法,從數(shù)據(jù)中訓(xùn)練出一個(gè)從特征到標(biāo)簽的映射關(guān)系模型。如圖2所示,信號(hào)指紋定位算法包括確定性的定位算法和基于概率的定位算法兩部分,其計(jì)算過(guò)程可分兩個(gè)階段:列車(chē)位置數(shù)據(jù)庫(kù)的建立階段和列車(chē)位置的估計(jì)階段。

圖2 列車(chē)位置數(shù)據(jù)指紋法的相關(guān)算法
基于無(wú)線(xiàn)信號(hào)指紋定位算法建立列車(chē)輔助定位模型,其技術(shù)要點(diǎn)主要包括:①因ATS數(shù)據(jù)具有較高的精度,該算法將ATS數(shù)據(jù)作為標(biāo)簽;②指紋算法采用的特征數(shù)據(jù)為4G/5G的空口數(shù)據(jù)(包括但不僅限于通信時(shí)間、小區(qū)標(biāo)識(shí)、小區(qū)電頻強(qiáng)度等),通過(guò)算法結(jié)果預(yù)測(cè)列車(chē)的位置;③通過(guò)AI模型學(xué)習(xí)方法訓(xùn)練得到從特征到標(biāo)簽的映射關(guān)系模型。
本研究在上海軌道交通9號(hào)線(xiàn)的曹路站—楊高中路站區(qū)段(均為地下段)進(jìn)行了現(xiàn)場(chǎng)測(cè)試。因信號(hào)指紋定位算法需要輸入大量的測(cè)試數(shù)據(jù),才能確保得到良好的列車(chē)定位精度,為此,本研究在測(cè)試列車(chē)上安裝了帶有天線(xiàn)的通信模組,通過(guò)ATS得到該區(qū)段起始點(diǎn)位置,通過(guò)業(yè)務(wù)-特征維度映射技術(shù)將位置信息映射為指紋算法的標(biāo)簽數(shù)據(jù)。測(cè)試數(shù)據(jù)(如表1所示)主要來(lái)自于UE(用戶(hù)終端)和eNodeB(基站)的物理層、RLC(無(wú)線(xiàn)控制層),以及在無(wú)線(xiàn)資源管理過(guò)程中計(jì)算產(chǎn)生的測(cè)試報(bào)告。
將ATS數(shù)據(jù)和測(cè)試數(shù)據(jù)進(jìn)行篩選和拼接,在刪除4個(gè)列次的測(cè)試數(shù)據(jù)后,最終共采集到ATS系統(tǒng)的23 442個(gè)樣本數(shù)據(jù)及移動(dòng)網(wǎng)絡(luò)的14 275個(gè)樣本數(shù)據(jù)。基于這些樣本數(shù)據(jù),建立列車(chē)輔助定位仿真模型。
1) 特征初選:本研究基于對(duì)列車(chē)定位業(yè)務(wù)及其數(shù)據(jù)的理解,選擇與特征維度(如時(shí)間、電信強(qiáng)度、基站和小區(qū)等)相關(guān)的字段作為特征值。
2) 特征解析:將不同特征字段數(shù)據(jù)分類(lèi),通過(guò)設(shè)計(jì)數(shù)據(jù)處理方法和代碼等方法,使之成為統(tǒng)一的數(shù)據(jù)類(lèi)型。
應(yīng)用大數(shù)據(jù)和AI模型學(xué)習(xí)技術(shù)進(jìn)行數(shù)據(jù)挖掘時(shí),往往通過(guò)試錯(cuò)的方式來(lái)反復(fù)迭代計(jì)算、優(yōu)化挖掘結(jié)果,最終得到最優(yōu)解。根據(jù)數(shù)據(jù)挖掘原理,本研究有以下3種特征優(yōu)選方法可供選擇:
1) 隨機(jī)森林模型中所有決策樹(shù)的平均不純度衰減法:通過(guò)隨機(jī)森林模型中所有決策樹(shù)得到的平均不純度衰減,用以度量各個(gè)變量的重要性,將重要性高的變量作為特征值。
2) 遞歸特征消除法:其主要思想是反復(fù)構(gòu)建模型,將選出最好或最差的特征放到一邊;然后在剩余的特征中重復(fù)這個(gè)過(guò)程,直到所有特征都遍歷,并保留特定數(shù)量的特征。
3) 通過(guò)主成分分析實(shí)現(xiàn)特征降維:在主成分分析中將原始特征通過(guò)一系列的線(xiàn)性組合,形成低維的特征,以去除數(shù)據(jù)的相關(guān)性;降維后的數(shù)據(jù)應(yīng)最大程度地保持原始高維數(shù)據(jù)的方差信息。
本研究選擇隨機(jī)森林模型中所有決策樹(shù)的平均不純度衰減法作為列車(chē)輔助定位模型的特征優(yōu)選方法,并基于此方法進(jìn)行了特征優(yōu)選。

表1 實(shí)際測(cè)試數(shù)據(jù)表
1.4.1 選擇模型范式
模型的范式主要包括監(jiān)督學(xué)習(xí)范式、無(wú)監(jiān)督學(xué)習(xí)范式及強(qiáng)化學(xué)習(xí)范式3種形式。根據(jù)列車(chē)定位模型的實(shí)際情況,需要給出列車(chē)具體位置的一系列樣本和數(shù)據(jù),供機(jī)器進(jìn)行自學(xué)習(xí)。所以,本文優(yōu)選有監(jiān)督模型范式,即根據(jù)訓(xùn)練數(shù)據(jù),通過(guò)基于無(wú)線(xiàn)信號(hào)指紋定位算法得到訓(xùn)練模型f(x)(一個(gè)x→y的映射關(guān)系f)。在機(jī)器訓(xùn)練完成后,得到正式模型h(x),以便在輸入新樣本x后,可得到預(yù)測(cè)結(jié)果y,其原理如圖3所示。

圖3 機(jī)器有監(jiān)督學(xué)習(xí)模型示意圖
1.4.2 選擇學(xué)習(xí)模型
可在集成學(xué)習(xí)、傳統(tǒng)機(jī)器學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)等模型中優(yōu)選所需的學(xué)習(xí)模型。綜合考慮列車(chē)輔助定位模型的實(shí)際情況,通過(guò)大量的迭代計(jì)算,本研究采用集成學(xué)習(xí)模型進(jìn)行建模。
集成學(xué)習(xí)模型是一種從錯(cuò)誤中進(jìn)行學(xué)習(xí)的技術(shù),可以較好地應(yīng)用到數(shù)字預(yù)測(cè)模型中。該模型可以訓(xùn)練程序做出某一決定。程序?qū)⑹盏降臒o(wú)線(xiàn)信號(hào)指紋輸入分配到集成算法的個(gè)體學(xué)習(xí)器中,并搜集各個(gè)體學(xué)習(xí)器產(chǎn)生的列車(chē)位置預(yù)測(cè)結(jié)果,通過(guò)投票法、平均法等結(jié)合算法,選出最優(yōu)的預(yù)測(cè)結(jié)果并輸出。
1.4.3 選擇評(píng)估參數(shù)
在機(jī)器學(xué)習(xí)過(guò)程中,可以得到查準(zhǔn)率P與查全率R這兩個(gè)數(shù)據(jù)。P的R的計(jì)算式為:
(1)
(2)
式中:
P——查準(zhǔn)率,指被機(jī)器學(xué)習(xí)認(rèn)為是正確的樣本數(shù)與樣本總數(shù)之比;
TP——被機(jī)器學(xué)習(xí)認(rèn)為正確且實(shí)際也是正確的樣本;
FP——被機(jī)器學(xué)習(xí)認(rèn)為正確但實(shí)際是錯(cuò)誤的樣本;
R——查全率,指被機(jī)器學(xué)習(xí)認(rèn)為是正確的樣本數(shù)與應(yīng)當(dāng)被機(jī)器學(xué)習(xí)認(rèn)為是正確的樣本數(shù)之比;
Fn——未被機(jī)器學(xué)習(xí)認(rèn)為正確但實(shí)際是正確的樣本。
在訓(xùn)練機(jī)器學(xué)習(xí)模型過(guò)程中,往往希望能夠兼顧查準(zhǔn)率和查全率,并使用一個(gè)統(tǒng)一的單值評(píng)價(jià)指標(biāo)來(lái)評(píng)價(jià)機(jī)器學(xué)習(xí)模型的訓(xùn)練效果。因此,通過(guò)計(jì)算得到查準(zhǔn)率與查全率的調(diào)和平均數(shù)f1,f1是一個(gè)可以綜合評(píng)估查全率和查準(zhǔn)率的指標(biāo)。
(3)
f1=1時(shí),說(shuō)明查準(zhǔn)率和查全率指標(biāo)都是100%,即沒(méi)有漏檢和誤檢。此時(shí)列車(chē)定位預(yù)測(cè)模型越接近理論最優(yōu)模型,能準(zhǔn)確輸出列車(chē)行駛過(guò)程中所有的真實(shí)位置。
根據(jù)采集到的樣本數(shù)據(jù)(即測(cè)試的開(kāi)行列次),將列車(chē)定位精度分別劃分50 m、100 m、150 m和200 m柵格。對(duì)這4種柵格尺寸下樣本進(jìn)行統(tǒng)計(jì),可得到不同柵格尺寸下的樣本數(shù)量的平均值和最小值,如表2所示。

表2 不同柵格尺寸下的樣本數(shù)據(jù)分布
根據(jù)樣本數(shù)量的分布情況,通過(guò)大量的迭代測(cè)試和優(yōu)化,本次采用200 m柵格建立列車(chē)輔助定位模型,此時(shí)模型輸出較為均衡的定位精度為200 m柵格。在大量的迭代測(cè)試和優(yōu)化中,模型的輸出有微小的變化,其評(píng)估指標(biāo)f1也略有不同。f1=0.763 540 191是迭代過(guò)程中出現(xiàn)的最高值。
綜上分析,得到如下結(jié)論:①列車(chē)輔助定位模型可以穩(wěn)定運(yùn)行并輸出列車(chē)的位置數(shù)據(jù);②列車(chē)輔助定位模型可輸出較為均衡的位置數(shù)據(jù),當(dāng)定位精度為200 m柵格時(shí),f1=0.763 540 191;③如表3所示,對(duì)柵格尺寸、樣本數(shù)量平均值和f1三者的關(guān)系進(jìn)行對(duì)比分析可知,樣本數(shù)據(jù)與柵格尺寸存在較強(qiáng)的正相關(guān)性,柵格尺寸每增加50 m,樣本數(shù)據(jù)約增加25個(gè),樣本數(shù)量和f1也存在較強(qiáng)的正相關(guān)性。

表3 柵格尺寸、樣本數(shù)量及f1關(guān)聯(lián)度列表
從實(shí)際測(cè)試的效果看,200 m柵格的定位精度基本可以滿(mǎn)足列車(chē)降級(jí)運(yùn)行下的定位需求。從建模評(píng)估數(shù)據(jù)看,在保持f1不明顯下降的前提下,若需增加10個(gè)開(kāi)行列次的測(cè)試數(shù)據(jù),列車(chē)的定位精度預(yù)計(jì)需在150 m左右;若增加50個(gè)開(kāi)行列次的測(cè)試數(shù)據(jù),列車(chē)的定位精度預(yù)計(jì)應(yīng)在50 m以?xún)?nèi)。
本文采用信號(hào)指紋定位算法,利用民用通信4G/5G網(wǎng)絡(luò)的無(wú)線(xiàn)信號(hào),實(shí)現(xiàn)了列車(chē)在地下線(xiàn)路區(qū)間的定位。經(jīng)測(cè)試,該算法可以至少實(shí)現(xiàn)200 m的定位精度,基本能夠滿(mǎn)足列車(chē)降級(jí)運(yùn)行下的輔助定位需求。此外,該算法還可以為其他應(yīng)用提供服務(wù),如內(nèi)燃機(jī)車(chē)等工程車(chē)輛在正線(xiàn)施工時(shí)的定位、不同信號(hào)制式線(xiàn)路間列車(chē)轉(zhuǎn)線(xiàn)時(shí)的定位等。在下一階段的工作中,應(yīng)進(jìn)一步擴(kuò)大標(biāo)記數(shù)據(jù)樣本的來(lái)源和數(shù)量,以探索不同場(chǎng)景下基于無(wú)線(xiàn)信號(hào)的列車(chē)定位性能的極限。