張璐巖,賈磊
(中國(guó)移動(dòng)通信集團(tuán)陜西有限公司,西安 710077)
截至2017年底,我國(guó)高鐵運(yùn)營(yíng)總里程接近30 000 km,全年運(yùn)送旅客約17.13億次,同比增長(zhǎng)18.7%。即時(shí)通信、網(wǎng)頁瀏覽、流媒體視頻、手機(jī)網(wǎng)游等業(yè)務(wù)是當(dāng)下高鐵旅途中旅客打發(fā)時(shí)間消遣的主要方式。為保證用戶網(wǎng)絡(luò)體驗(yàn)感知,高效、準(zhǔn)確、低成本的識(shí)別高鐵用戶、優(yōu)化高鐵網(wǎng)絡(luò)就顯得至關(guān)重要。
用戶在高鐵環(huán)境下對(duì)移動(dòng)網(wǎng)絡(luò)業(yè)務(wù)體驗(yàn)的需求隨時(shí)考驗(yàn)著我們高鐵移動(dòng)網(wǎng)絡(luò)建設(shè)和優(yōu)化成果。以目前的高鐵網(wǎng)絡(luò)優(yōu)化情況來看,仍面臨著以下幾個(gè)主要問題。
傳統(tǒng)高鐵網(wǎng)絡(luò)優(yōu)化工作主要依靠人工儀表拉網(wǎng)測(cè)試、獲取數(shù)據(jù)進(jìn)行分析,測(cè)試時(shí)間成本、資源成本較高,且網(wǎng)絡(luò)分析對(duì)優(yōu)化人員能力要求較高。
識(shí)別高鐵用戶的成本較高,當(dāng)前高鐵用戶識(shí)別的主流方法是利用多普勒頻移、切換序列等方法實(shí)現(xiàn),復(fù)雜度較高、硬件設(shè)施要求嚴(yán)格。
用戶群共性問題不易體現(xiàn),多數(shù)體現(xiàn)為測(cè)試機(jī)及所在位置的網(wǎng)絡(luò)問題,不能代表真實(shí)用戶感知。
為滿足當(dāng)下高鐵網(wǎng)絡(luò)優(yōu)化的需求,急需一種全新的優(yōu)化手段來代替?zhèn)鹘y(tǒng)的優(yōu)化方式。
為節(jié)省優(yōu)化成本,需將大量重復(fù)性的人工工作轉(zhuǎn)化為自動(dòng)優(yōu)化。本文從識(shí)別高鐵用戶群體出發(fā),利用相關(guān)網(wǎng)絡(luò)數(shù)據(jù)判別出公專網(wǎng)頻繁切入切出問題,運(yùn)用聚類算法發(fā)現(xiàn)問題高發(fā)區(qū)域,建立自動(dòng)優(yōu)化體系并應(yīng)用于實(shí)踐。
高鐵用戶的行為特征是在一定時(shí)間內(nèi)具有相同的運(yùn)動(dòng)軌跡。利用該特點(diǎn)及MR采樣數(shù)據(jù),可從時(shí)間及空間兩個(gè)維度聯(lián)合判定,識(shí)別符合高鐵用戶特點(diǎn)的用戶信息。
其中,上述MR采樣數(shù)據(jù)來源為UE側(cè)物理層上報(bào)無線信號(hào)的測(cè)量結(jié)果,用于移動(dòng)性管理中切換/重選事件的觸發(fā),包含采樣時(shí)間、小區(qū)ID、MME-UES1AP-ID、RSRP等信息。
下面將從時(shí)間、空間維度分別分析,并描述高鐵用戶識(shí)別的具體原理。
在高鐵G站的用戶從時(shí)間和空間維度可分別表示為:

其中, G為表示高鐵G站時(shí)間、空間的二維矩陣,A與B分別為表示時(shí)間及空間維度的矩陣。
時(shí)間(A):從時(shí)間維度,MR數(shù)據(jù)采集時(shí)段需在高鐵停運(yùn)時(shí)間之外,建議冗余為15 min。如當(dāng)高鐵列車從A站至B站,發(fā)車時(shí)間為9:00,到站時(shí)間為9:35,則考慮到用戶在高鐵站等樞紐滯留時(shí)間,數(shù)據(jù)采集時(shí)間建議為8:45~9:50。當(dāng)用戶占用G1站高鐵小區(qū)時(shí)間與占用G2站高鐵小區(qū)時(shí)間差等于列車從G1站至G2站的時(shí)間,則認(rèn)為從時(shí)間維度該用戶符合高鐵用戶特點(diǎn)。
空間(B):選取高鐵車站覆蓋小區(qū)進(jìn)行比對(duì),當(dāng)某用戶占用過不同高鐵站的覆蓋小區(qū)時(shí),認(rèn)為該用戶從空間維度符合高鐵用戶特點(diǎn)。
將時(shí)間、空間結(jié)合運(yùn)算,取二維矩陣G1與G2的交集,即當(dāng)某一用戶同時(shí)占用過兩個(gè)不同高鐵車站的覆蓋小區(qū),且該用戶占用兩高鐵站專網(wǎng)小區(qū)的時(shí)間間隔與兩個(gè)車站間列車的行駛時(shí)間相符,則該用戶為高鐵用戶。
將高鐵用戶的MR數(shù)據(jù)通過OTT實(shí)現(xiàn)地理位置定位,采用比對(duì)算法分析占用小區(qū)合理性,甄別公專網(wǎng)切入切出的網(wǎng)絡(luò)問題,并記錄問題采樣點(diǎn),借助K-means聚類算法不斷進(jìn)行聚合、鎖定出專網(wǎng)問題的高發(fā)區(qū)域。
其中,運(yùn)營(yíng)商為保障用戶能夠獲得良好的業(yè)務(wù)感知,在重點(diǎn)交通道路沿線建設(shè)專網(wǎng)進(jìn)行覆蓋,用戶在使用專網(wǎng)信號(hào)時(shí),因某種原因脫離專網(wǎng)信號(hào)進(jìn)入公網(wǎng)的現(xiàn)象,稱之為出專網(wǎng)問題。高鐵問題區(qū)域識(shí)別方法流程如圖1所示。
2.2.1 基于信令中OTT關(guān)聯(lián)實(shí)現(xiàn)MR數(shù)據(jù)定位
OTT定位指依托互聯(lián)網(wǎng)向用戶提供的各種應(yīng)用服務(wù),基于APP軟件獲取用戶的位置信息。通過采集用戶S1-U接口中的HTTP原始碼流來獲取對(duì)應(yīng)用戶此時(shí)刻的OTT應(yīng)用信息,先后經(jīng)歷數(shù)據(jù)清洗、數(shù)據(jù)篩選,獲得有用的位置信息;同時(shí),基于時(shí)間和MME-UES1AP-ID信息將MR數(shù)據(jù)與OTT定位經(jīng)緯度位置信息進(jìn)行關(guān)聯(lián),實(shí)現(xiàn)此時(shí)刻的 MR數(shù)據(jù)定位。MR經(jīng)緯度關(guān)聯(lián)算法示意如圖2所示。
2.2.2 基于MR數(shù)據(jù)判別出專網(wǎng)問題

圖1 高鐵問題區(qū)域識(shí)別方法流程圖

圖2 MR經(jīng)緯度關(guān)聯(lián)算法示意圖
提取MR數(shù)據(jù)中每個(gè)高鐵用戶的占用小區(qū)信息,將高鐵專網(wǎng)小區(qū)(按行駛方向排列)與用戶占用小區(qū)(按時(shí)間序列排序)進(jìn)行匹配,若連續(xù)序列中長(zhǎng)時(shí)間、多次出現(xiàn)占用非專網(wǎng)的小區(qū),則判定為出專網(wǎng)事件。由于每個(gè)用戶在乘坐高鐵時(shí)可能存在多次出專網(wǎng)事件,故回到專網(wǎng)后需繼續(xù)匹配,并記錄出每一次專網(wǎng)的MR采樣點(diǎn)。高鐵專網(wǎng)問題識(shí)別流程如圖3所示。

圖3 高鐵專網(wǎng)問題識(shí)別流程圖
2.2.3 借助K-means聚類算法鎖定問題高發(fā)區(qū)域
如圖4所示,基于高鐵場(chǎng)景的K-means算法描述如下。
(1)選取K個(gè)出專網(wǎng)MR采樣點(diǎn)作為初始聚類中心??筛鶕?jù)高鐵小區(qū)覆蓋能力,間隔一定距離(如2 km)取K個(gè)經(jīng)緯度作為初始中心點(diǎn)。
(2)將所有出專網(wǎng)MR采樣點(diǎn)按最小距離原則分配到最鄰近聚類。上述最小距離,由每個(gè)采樣點(diǎn)與初始中心點(diǎn)經(jīng)緯度的歐幾里距離計(jì)算,即對(duì)于第i個(gè)出專網(wǎng)的MR采樣點(diǎn),其與第k個(gè)初始中心的距離可表示為dik=,若 min(dik)=,則采樣點(diǎn)i此次歸于k(k∈K,表示迭代過程中的中心點(diǎn)之一)聚類族中。
(3)根據(jù)聚類的結(jié)果,對(duì)于K個(gè)分組,取每個(gè)分組的經(jīng)緯度的均值,重新計(jì)算K個(gè)聚類的中心,并作為新的聚類中心。

圖4 借助k-means聚類算法鎖定問題高發(fā)區(qū)域示意圖

圖5 高鐵斷點(diǎn)問題自動(dòng)分析的流程圖
導(dǎo)致高鐵用戶出專網(wǎng)的問題主要原因有基站故障、切換參數(shù)不合理、RF優(yōu)化不合理、小區(qū)擁塞等,結(jié)合問題原因的優(yōu)化方案及日常優(yōu)化工作經(jīng)驗(yàn)?zāi)M人工分析問題思維形成一套自動(dòng)分析優(yōu)化體系,同時(shí)根據(jù)實(shí)際情況檢驗(yàn)方案的準(zhǔn)確性,針對(duì)判決條件有誤的流程及時(shí)修改,提高分析問題的精準(zhǔn)度。
建議的自動(dòng)分析優(yōu)化流程如圖5所示。
為說明本文所提基于用戶群的高鐵專網(wǎng)斷點(diǎn)定位方法的有效性,通過仿真和實(shí)際工作驗(yàn)證了所提算法的性能。
(1)隨著用戶數(shù)增長(zhǎng),所提算法的準(zhǔn)確率增高且逐漸接近于100%。
(2)以月為粒度,所提方法獲取的有效采樣點(diǎn)數(shù)高達(dá)百萬級(jí),全面體現(xiàn)了用戶群共性問題;而傳統(tǒng)優(yōu)化方法獲取的有效采樣點(diǎn)數(shù)為十萬級(jí),只能體現(xiàn)測(cè)試機(jī)及所在位置。
(3)本文所提方法依托于現(xiàn)有數(shù)據(jù)采集平臺(tái)進(jìn)行自動(dòng)分析,幾乎無成本;而傳統(tǒng)優(yōu)化方法需消耗大量人力、車輛費(fèi)用、設(shè)備費(fèi)用和話費(fèi),大中級(jí)地市每年優(yōu)化成本近百萬。
由上述可知,本文所提算法能在消耗更少資源的情況下實(shí)現(xiàn)與傳統(tǒng)優(yōu)化方法相近的效果。
為更好說明所提算法在實(shí)際工作中的效果,選取某高鐵試點(diǎn)應(yīng)用。提取MR、信令等相關(guān)數(shù)據(jù),參照基于大數(shù)據(jù)的高鐵群用戶優(yōu)化方法識(shí)別高鐵用戶并整理篩查出專網(wǎng)問題,匯聚后自動(dòng)分析并輸出優(yōu)化方案?,F(xiàn)場(chǎng)驗(yàn)證優(yōu)化方案,智能分析準(zhǔn)確率高達(dá)95%以上。詳細(xì)過程如下。
確定覆蓋某始發(fā)客站、某到達(dá)客站及沿線的高鐵小區(qū)清單。
查詢高鐵客運(yùn)表該線路運(yùn)營(yíng)時(shí)段為7:30~23:59,兩車站間的運(yùn)行時(shí)間為1 h。
提取連續(xù)3天的信令數(shù)據(jù),統(tǒng)計(jì)某高鐵用戶約1.5萬人。
(4)提取相應(yīng)時(shí)段高鐵用戶的MR數(shù)據(jù),通過關(guān)聯(lián)信令數(shù)據(jù)獲得當(dāng)時(shí)刻點(diǎn)的MR經(jīng)緯度信息。
(5)與某高鐵小區(qū)匹配,共篩查出頻繁切入切出專網(wǎng)問題2 700多條。
(6)將切入切出專網(wǎng)問題點(diǎn)經(jīng)緯度和10個(gè)初始聚合中心輸入K-means聚類算法,得到4個(gè)切入切出專網(wǎng)頻次較高的密集區(qū)域。
(7)把密度較高的4個(gè)區(qū)域內(nèi)的小區(qū)問題按照自動(dòng)分析優(yōu)化體系進(jìn)行分析,最終將問題定位為集中的6個(gè)高鐵小區(qū)的故障告警和參數(shù)設(shè)置不合理所致。
基于大數(shù)據(jù)的優(yōu)化方法數(shù)據(jù)來源廣、反映問題全、更貼近用戶真實(shí)感受,可有效挖掘網(wǎng)絡(luò)共性問題,解決用戶需求。相比傳統(tǒng)優(yōu)化手段,數(shù)據(jù)采集自動(dòng)化、數(shù)據(jù)分析自動(dòng)化,大幅降低人力成本和提升工作效率。本文提出的網(wǎng)絡(luò)優(yōu)化方法不僅適用于高鐵場(chǎng)景,也可用于高速、景區(qū)等區(qū)域特征明顯的場(chǎng)景,后續(xù)工作中可進(jìn)一步推廣至其它場(chǎng)景。