盧 山
(中國移動通信集團山西有限公司,山西 太原 030032)
隨著移動互聯網的迅猛發展,基于位置的服務(LBS)廣泛應用于人們的工作和生活之中。由于各種各樣的無線網絡信號充斥于人們的工作與生活空間,因此基于無線網絡信號獲取用戶位置日益成為的用戶定位領域的熱點課題[1],基于無線網絡信號獲取用戶位置的優勢在于無線網絡信號具有泛在性且其部署成本較低。MR定位是較為新興的基于移動通信網絡的用戶定位方法。利用MR中的用戶終端接收周圍小區的場強,再通過數學模型推斷用戶位置,其平均定位精度可達50 m~100 m。MR指紋定位算法[2]是為網絡覆蓋區域的每個位置建立信號特征指紋,該特征指紋即從網絡角度代表用戶的位置,與網絡覆蓋的實際位置基本存在一一映射的關系,可以獲得較高的定位精度。該文以MR指紋定位技術為基礎,賦能一個基于最小化路測( Over The Top, OTT;Minimization of Drive-Tests,MDT )訓練數據的在線學習系統,研究與構建了一套具備在線學習能力的MR定位系統。MR智能定位系運行過程中可以實現對指紋模型參數、指紋模型參數自適應工參變化以及定位算法參數進行自學習的功能,以弱化網絡變化或者無線環境變化對定位性能的影響。
移動通信網絡無處不在,只要用戶終端進行通信,就會產生信令數據,而且可以零成本獲得這些信令數據。正是由于移動網絡及數據具有泛在性和低成本性的特點,因此研究基于移動網絡的用戶定位成為獲取用戶位置的熱點課題。OTT/MDT數據是一種帶有經緯度坐標的消息(下文為位置消息),當用戶終端執行輔助全球衛星定位系統(Assisted Global Positioning System,AGPS )業務、MDT業務或者導航業務時,會產生這類消息。MR是信令消息的一種,是用戶終端在執行通信過程中周期性或者在事件觸發時上報給網絡的消息,其不僅包括時間、小區以及用戶標識信息,而且包括主服務小區和相鄰小區的場強信息。
OTT/MDT數據不僅包括時間、小區以及用戶標識信息,而且包括用戶的位置信息。該定位方法雖然只覆蓋極少數的用戶,但是能夠滿足指紋訓練的需求。
基于時間、用戶標識、服務小區標識、MMEUeS1APId(4G)或者AMFUENGAPID(5G)將OTT/MDT與MR進行關聯,生成帶位置坐標的MR數據,將其作為定位系統的訓練MR數據。
指紋(Fingerprint,FP)是對特定位置信號特征的刻畫,不同位置指紋的差異是指紋定位的基礎,一個指紋一般由一個或多個信號特征模型(下文稱為Finger)組成。
柵格指紋利用柵格區域代表一個位置區域,柵格尺度為10 m×10 m,采用混合高斯模型(Gaussian Mixed Model,GMM)來描述柵格指紋??紤]到信號量(例如參考信號接收功率: Reference Signal Receiving Power,RSRP)在測量過程中會存在噪聲誤差(即在同一個位置信號量不是一個不變值,而是疊加了噪聲),因此該技術方案采用高斯分布N(μ、σ2)對Finger進行描述,其中μ是信號量的平均值,σ2是信號量的方差,即對訓練數據中的每一個無線網絡信號的信號測量值進行高斯處理。
采用GMM模型來刻畫柵格指紋的原因是一個柵格中的MR信號量分布往往并不接近高斯分布,例如一個柵格中可能存在室內和室外兩類訓練MR數據。該技術方案默認混合高斯模型的分量為2個(也可以設置更多,具體看實際的信號復雜程度)。
混合高斯指紋模型如公式(1)所示,包括2個高斯分量的高斯指紋。

式中:fingeri為柵格指紋的第i個手指(Finger);menanij代表fingeri的第j個高斯分量的平均值;stdij代表fingerj的第j個高斯分量的標準方差;αij為每個高斯分量在混合高斯分布中所占的比重,;weighti為 每 個finger在Fingerprint中的權重,即對應RSSI出現次數的歸一化值,且;Confidence1為finger的置信度,在指紋庫健康性監測時會用到Confidence1,便于了解指紋庫的可靠性。
在生成混合高斯模型柵格指紋的過程中,首先,根據訓練MR數據位置信息將MR數據映射到對應的柵格;其次,通過期望最大化(Expectation Maximization Algorithm,EM)算法對柵格中的MR信號量進行分類,每類信號量分別生成對應的高斯分量參數,即生成了混合高斯柵格指紋。
MR指紋定位算法就是指紋匹配算法,主要采用樸素貝葉斯估計算法計算某MR在柵格中的概率值,取概率值最大的柵格,即為該MR所在的柵格位置,如公式(2)所示。

式中:P(MR)是邊際概率;P(GridA)為先驗概率;GridA代表柵格A;P(MR|GridA)為似然函數,表示在已知柵格A的情況下,最可能出現MR的概率。
例如,下面是數據集中的第i個MR數據。

其中ecij和RSRPij分布是MRi的第i個小區標識和第j個信號場強。
由于混合高斯分布的形式如公式(3)、公式(4)所示。

式中:αk為每個高斯分量在混合高斯分布中所占的比重,;Θk為第k個高斯分量的參數;yi為第i個RSRP值;uk為第k個高斯分量的均值;∑k為第k個高斯分量的協方差。
綜上可計算得P(MR|Gridi)(i=A,B,…)各個柵格的概率值,選取后驗概率最大的柵格,即為該MR的位置。
基于OTT/MDT MR訓練數據的在線學習系統架構圖如圖1所示。

圖1 基于OTT/MDT MR訓練數據的在線學習系統架構圖
其中位置回填是將OTT/MDT中的位置數據與MR中的信號場強信息進行關聯,生成訓練MR數據。
生成訓練MR數據后可以實現指紋參數自適應工參變化、指紋參數自學習以及定位算法參數自學習的功能。
利用訓練MR數據對指紋參數,即每個Finger的GMM參數(每個分量的平均值、標準方差和分量權重)進行訓練。
由于不同類型的MR數據的可靠性不同,因此可以設置不同的權重因子來對數據進行區分,然后融合生成指紋。
考慮無線傳播環境是會變化的,網絡也是會變化的,因此MR收集時間距離定位時間點的時間越長,有效性越低,MR也需要用權重來區別。
為了簡化算法,且便于維護與優化,只通過時間權重來區分2類數據(過往數據權重及本期數據權重)。初次構建指紋庫時,只有本期權重,即權重為1。
利用收集的訓練MR數據更新現有的GMM指紋的過程如下。
現假設某柵格號A有n條訓練MR數據,而現有的數據是以某小區eci1為主小區的所有MR數據,所以該柵格A內可能有多條MR數據,但主小區均為eci1。數據如下。


現提取該柵格內的所有小區及其對應的電平(RSRP),得到的數據如下。

將歷史生成的上述電平數據以文件的形式保存下來,與新收集的電平數據合并,利用混合高斯分布生成每個finger的混合高斯指紋。
新建站、擴容以及PCI規劃等日常網絡運維會導致工程參數處于動態變化中。工程參數的變化會對指紋造成直接影響,導致前期生成的柵格指紋不能準確反映當前的網絡覆蓋情況,甚至使柵格指紋完全失效。
因此,需要通過自學習算法讓柵格指紋庫快速、自動地適應工程參數的變化,時刻為MR指紋定位提供一個可靠、準確的指紋信息。
柵格指紋自適應更新。柵格指紋中的某ECI對應的小區工程參數發生變化,則ECI對應的Finger自動進行修正,以補償該變化,具體實現算法如下。
Finger中的指紋是由GMM生成的均值(mean)、方差(variance)和分量權重(prior)組成的。為了便于指紋更新,其附帶了生成指紋的中間結果
最新的訓練MR數據更能夠反映當前的位置信號特征,因此為了保證新的訓練數據以較高的權重參與生成指紋的過程,舊數據隨著時間的流失在指紋生成中的效用也逐漸降低,在指紋生成中采用老化系數來對新舊數據進行加權處理,如公式(5)所示。

式中:α為老化系數,α=0~1;Countn-1為該次指紋更新之前積累的 MR 個數。Countn為該次與之前通過老化處理后合并的MR個數。
該方案指紋匹配算法采用的是樸素貝葉斯()算法,其本身由最大似然、先驗概率和邊緣概率組成。該方案對先驗概率進行改造,構造了均衡函數以控制先驗概率對匹配結果的影響。下文介紹使用訓練MR數據對貝葉斯模型進行訓練的過程。
3.5.1 先驗概率自學習
影響貝葉斯模型匹配效果的參數主要是公式(6)中先驗概率P(MR|GridA),該算法通過設計弱化函數對其進行均衡處理(弱化處理)。

說明:由于P(MR|GridA)本身是位于區間[0,1]的數值,因此通過將index設置為[0,1]可以弱化其對計算概率的影響,同時通過控制index的大小可以控制其弱化程度。
考慮到不同指紋Finger個數對先驗概率的要求不同,因此需要分別對不同Finger的MR進行訓練。首先,設置目標函數。目標函數是根據對該平臺性能平均的指標來確定的,設置為實際位置與定位位置偏差≤100m的占比。每次迭代時,僅對index、index+0.1以及index-0.1設置值進行比較求最佳。
3.5.2 缺省標準差
對于小區ECI對應的RSSI集合不能滿足構建Gauss模型的情況,通過賦值缺省Default Gauss Variance建立Gauss模型??梢詫υ揈CI其他柵格的Gauss Variance進行加權平均得到,權值設為柵格距離的倒數。當訓練MR數據累積到一定門限(例如20個RSSI值)時,自動切換到標準高斯模型參數求解過程。
將MR智能定位系統投入山西移動日常生產中。下面是利用2019年4月和5月的定位結果對定位算法性能進行評估。選擇具有道路、居民區、商務區以及城中村等場景在內的30 km2區域進行算法測試。
MR智能定位系統的在線學習能力通過自動調整系統參數來適應數據和網絡環境的變化,在系統運行中具有提升定位精度和穩定性的作用。
基于移動網絡進行用戶定位的挑戰在于移動網絡的自身變化和無線環境的變化都存在較大的不確定性,難以保證定位精度和定位性能。該技術方案構建的 MR智能定位系統以建立GMM柵格指紋庫并利用樸素貝葉斯指紋匹配算法作為MR定位的基礎算法。在該基礎上,利用在線獲得的訓練MR數據對指紋參數和樸素貝葉斯定位參數進行在線訓練,確保算法模型參數能夠真實反映無線網絡自身的變化和無線網絡環境的變化,從而保證MR定位具有較高的精確性和穩定性。