王智博
(中通服網(wǎng)優(yōu)技術(shù)有限公司,上海,200050)
CDMA網(wǎng)絡(luò)中用戶通話記錄的GIS分析概述
王智博
(中通服網(wǎng)優(yōu)技術(shù)有限公司,上海,200050)
CDMA無線網(wǎng)絡(luò)中,主流廠商的無線設(shè)備都會(huì)生成用戶的通話記錄數(shù)據(jù),如阿爾卡特朗訊公司的PCMD(Per Call Measure Data) 和摩托羅拉公司的CDL(Call Detail Log)等。相比傳統(tǒng)無線網(wǎng)絡(luò)優(yōu)化手段(DT、CQT)和性能統(tǒng)計(jì)指標(biāo)(KPI)而言,用戶通話記錄能提供無線環(huán)境信息以及用戶和終端屬性,通過對(duì)其的分析和運(yùn)用,已經(jīng)在無線網(wǎng)絡(luò)運(yùn)維和優(yōu)化工作中發(fā)揮了舉足輕重的作用,并且還有相當(dāng)深度的潛力有待挖掘。除了常規(guī)的統(tǒng)計(jì)學(xué)分析方法之外,在實(shí)際應(yīng)用中基于GIS的分析方法越來越受到重視。本文概括總結(jié)了用戶通話記錄應(yīng)用中的GIS定位分析、GIS空間分析和GIS柵格分析等方法,并對(duì)這些方法的業(yè)務(wù)應(yīng)用場景做了歸納和總結(jié)。
用戶通話記錄;PCMD CDL;時(shí)態(tài)GIS
用戶通話記錄數(shù)據(jù)是海量的通話狀態(tài)詳細(xì)記錄,每個(gè)通話(語音、短信、數(shù)據(jù))都會(huì)產(chǎn)生一條記錄。不同廠商設(shè)備用戶通話記錄的字段數(shù)、字段屬性、字典表等會(huì)有不同,但經(jīng)過提取、翻譯、計(jì)算等處理后可以篩選出一些公有屬性,這也為統(tǒng)一地分析和應(yīng)用用戶通話記錄數(shù)據(jù)提供了可能。
用戶通話紀(jì)錄中的呼叫起始和呼叫結(jié)束位置經(jīng)緯度是非常重要的分析依據(jù),通過確定用戶的地理位置,結(jié)合基站的位置經(jīng)緯度,可以實(shí)現(xiàn)通話紀(jì)錄、用戶、基站小區(qū)的定位分析;可以實(shí)現(xiàn)基于地理位置的空間分析;可以實(shí)現(xiàn)柵格分析;本文分別總結(jié)了上述分析方法的基本原理與應(yīng)用,最后提出了基于時(shí)態(tài)GIS的分析方法及其應(yīng)用潛力。
所有的GIS分析方法和應(yīng)用的基礎(chǔ)是通話紀(jì)錄數(shù)據(jù)的定位,作為GIS分析的必備條件,定位的算法和精度影響著GIS分析的準(zhǔn)確性。
1.1 定位基礎(chǔ)
常見的用戶通話紀(jì)錄定位分為起始位置定位和終止位置定位。 每條通話紀(jì)錄中都包含勇于定位的信息,再結(jié)合基站小區(qū)的基礎(chǔ)信息即可實(shí)現(xiàn)位置定位。下面以阿爾卡特朗訊公司的PCMD(Per Call Measure Data)中起始位置定位為例進(jìn)行說明。
在定位計(jì)算時(shí)需要知道本次通話的主小區(qū)ID、第一個(gè)PSMM消息中的參考小區(qū)ID和第一個(gè)PSMM消息中的非參考小區(qū)ID,并且知道通話點(diǎn)距離這些小區(qū)之間的往返延時(shí)(Round Trip Delay, RTD),再結(jié)合所有上述小區(qū)對(duì)應(yīng)的基站ID和基站所在的經(jīng)緯度以及該基站的類別(室外站/室內(nèi)站)
如果需要精確計(jì)算,還需要知道基站的高度、下傾角等信息。
其中, 往返延時(shí)的單位是1/8chip,可以換算成距離。相關(guān)解釋如下:
在無線通信網(wǎng)絡(luò)中,電磁波在真空中的傳輸速度與光速相同為3*10^8 m/s, 在空氣中很接近真空速度,一般情況下也以光速計(jì)算;CDMA網(wǎng)絡(luò)中,前向信道和反向信道的碼片速率均為1.228 8Mbit/s; 因此每個(gè)碼片代表的距離為3*10^8/1。2288*10^6=244。140625m。粗略計(jì)算時(shí)可取每CHIP為244米。
因此移動(dòng)終端距基站小區(qū)的直線距離約為:RTD/8/2*244(單位米)。
1.2 定位算法
關(guān)于CDMA網(wǎng)絡(luò)中通話紀(jì)錄的定位算法,最常見是AFLT(Advanced Forward link trilateration,高級(jí)前向鏈路三角定位)算法。
為提高定位的準(zhǔn)確度和定位精度,張國華等在AFLT算法的
基礎(chǔ)上增加了定位補(bǔ)償因子并引入了工程參數(shù)的修正,其中補(bǔ)償因子主要是彌補(bǔ)實(shí)際無線環(huán)境中的非直線傳播、反射折射的影響而引入的針對(duì)不同場景而實(shí)際測量得出的定位計(jì)算系數(shù),如山區(qū)和密集市區(qū)的定位因子相差30%以上;而工程參數(shù)主要是通過小區(qū)的方向角來輔助計(jì)算只有一個(gè)或兩個(gè)基站時(shí)的經(jīng)緯度位置。
肖恒輝等設(shè)計(jì)了一種改進(jìn)的Fang算法,用以計(jì)算有三個(gè)或以上基站時(shí)的經(jīng)緯度位置。充分發(fā)揮全部基站的信息,共同提高了定位精度。
在為每條通話紀(jì)錄進(jìn)行起始位置和終止定位進(jìn)行定位之后,即可以得到很多應(yīng)用。
2.1 用戶位置定位
可以針對(duì)VIP用戶,進(jìn)行位置監(jiān)控和跟蹤。以獲取用戶的通話位置。 按照時(shí)間順序繪制一段時(shí)間內(nèi)的用戶位置即可形成用戶的運(yùn)動(dòng)軌跡。
在劉陽等的文章中,利用用戶的位置信息,對(duì)VIP客戶實(shí)施重點(diǎn)服務(wù)保障應(yīng)用,通過對(duì)用戶的通話習(xí)慣/業(yè)務(wù)類型、活動(dòng)區(qū)域、通話質(zhì)量的實(shí)時(shí)監(jiān)控,可以很好地了解客戶的業(yè)務(wù)使用情況,從而根據(jù)用戶的使用習(xí)慣為用戶定制一些差異化服務(wù)項(xiàng)目,在提高運(yùn)營商業(yè)務(wù)收入的同時(shí),也樹立了運(yùn)營商的服務(wù)品牌效應(yīng)。
譚鈞元等提出一種基于用戶位置定位的生活熵進(jìn)行用戶分類的算法,生活熵取值從0到80,數(shù)值越小表明用戶的位置變化越有規(guī)律。按照其統(tǒng)計(jì)結(jié)果,約53%的用戶生活熵在10以內(nèi),而僅有5%的用戶生活熵大于30。
2.2 用戶移動(dòng)速度
以通話終止位置與通話起始位置之間的距離除以通話紀(jì)錄中的通話時(shí)長,即可得出該通話期間用戶的移動(dòng)速度。從而可以在海量通話紀(jì)錄數(shù)據(jù)中篩選特定的紀(jì)錄進(jìn)行進(jìn)一步的分析。
如可以設(shè)定高鐵速度的閥值為大約150公里/小時(shí),來過濾出在高鐵上發(fā)生的通話紀(jì)錄,從而根據(jù)這些通話紀(jì)錄的CFC值,EC/IO等來判定和分析高鐵基站的通話質(zhì)量。從而為高鐵基站的優(yōu)化提供輔助依據(jù)。
在GIS空間分析的時(shí)候,一般需要根據(jù)小區(qū)的方向角把小區(qū)覆蓋范圍圖層繪制出來作為基礎(chǔ)底圖。小區(qū)覆蓋范圍在計(jì)算時(shí)一般情況下不考慮障礙物、樓宇高度等的影響,采用Delaunay三角網(wǎng)算法生成泰森多邊形(Voronoi diagram),其中室外小區(qū)的模擬信號(hào)覆蓋范圍是不規(guī)則多邊形,室內(nèi)站的模擬覆蓋范圍是一個(gè)半徑為50米的圓圈。
3.1 緩沖分析
緩沖區(qū)分析是指以點(diǎn)、線、面實(shí)體為基礎(chǔ),自動(dòng)建立其周圍一定寬度范圍內(nèi)的緩沖區(qū)多邊形圖層,然后建立該圖層與目標(biāo)圖層的疊加,進(jìn)行分析而得到所需結(jié)果。它是用來解決鄰近度問題的空間分析工具之一。
在重點(diǎn)區(qū)域?qū)崟r(shí)監(jiān)控應(yīng)用中,根據(jù)全網(wǎng)中熱點(diǎn)事件的事件和位置,事先設(shè)定需要監(jiān)控點(diǎn)和監(jiān)控路徑,再根據(jù)監(jiān)控等級(jí)設(shè)定監(jiān)控的緩沖區(qū)距離,通過實(shí)時(shí)用戶通話紀(jì)錄采集時(shí)候的位置過濾,實(shí)時(shí)篩選出緩沖區(qū)內(nèi)的用戶通話紀(jì)錄,再通過運(yùn)算成監(jiān)控指標(biāo)進(jìn)行實(shí)時(shí)呈現(xiàn)。
3.2 專題圖分析
專題地圖是按照分析主題的要求突出、完整地顯示一種或幾種特定要素而使地圖內(nèi)容、用途成為專題化的地圖,一般由底圖要素和專題要素組成。常見專題地圖類型如唯一值、區(qū)間專題、柱狀、餅狀等。
如根據(jù)一天內(nèi)所有小區(qū)的掉話率數(shù)據(jù),按照話務(wù)量大小劃分成5個(gè)區(qū)間制作掉話率專題圖。
柵格數(shù)據(jù)的空間分析就是在每一個(gè)柵格單元的基礎(chǔ)上進(jìn)行。如果單元過大則分析結(jié)果精確度降低,如果單元過小則會(huì)產(chǎn)生大量的數(shù)據(jù),而且計(jì)算速度降低。根據(jù)無線網(wǎng)絡(luò)分析的要求,一般設(shè)定100×100米的柵格為分析單元。把用戶通話紀(jì)錄定位到柵格內(nèi),再通過柵格內(nèi)各通話紀(jì)錄的其他業(yè)務(wù)屬性的平均值、求和等運(yùn)算計(jì)算出該柵格的名義色階進(jìn)而進(jìn)行后續(xù)的業(yè)務(wù)分析。本文主要介紹柵格密度分析的相關(guān)應(yīng)用。
4.1 柵格分析的基礎(chǔ)
針對(duì)分析區(qū)域,以分析區(qū)中心點(diǎn)為基礎(chǔ)原點(diǎn),向四個(gè)象限擴(kuò)展,以100×100米為界繪制分析區(qū)基礎(chǔ)柵格。以中心點(diǎn)向外擴(kuò)展可以盡量避免計(jì)算誤差的影響,使得分析區(qū)所有的柵格大小一致。按照方位對(duì)每個(gè)柵格進(jìn)行唯一編碼,作為后續(xù)用戶通話紀(jì)錄與柵格關(guān)聯(lián)的標(biāo)識(shí)。
在計(jì)算出通話紀(jì)錄的位置經(jīng)緯度后,與分析區(qū)中心點(diǎn)坐標(biāo)進(jìn)行距離計(jì)算,進(jìn)而求得該通話紀(jì)錄所在的柵格坐標(biāo)。在業(yè)務(wù)統(tǒng)計(jì)(如EC/IO、話務(wù)密度、導(dǎo)頻污染、通話質(zhì)量(FFER)、干擾分布等)時(shí),可以以通話紀(jì)錄柵格標(biāo)識(shí)分組統(tǒng)計(jì)。
4.2 柵格密度分析
本文以導(dǎo)頻污染為例,說明如何利用GIS柵格對(duì)用戶通話紀(jì)錄進(jìn)行分析。
導(dǎo)頻污染通常指當(dāng)移動(dòng)臺(tái)的激活集中有四個(gè)或者更多導(dǎo)頻信號(hào),這些導(dǎo)頻信號(hào)強(qiáng)度都很大并且沒有一個(gè)信號(hào)的強(qiáng)度足夠大成為真正的主導(dǎo)頻。在這些區(qū)域,由于其它不在移動(dòng)臺(tái)激活集中的強(qiáng)導(dǎo)頻信號(hào)的突然出現(xiàn)導(dǎo)致移動(dòng)臺(tái)在切換當(dāng)中經(jīng)常容易引起掉話。因此,強(qiáng)導(dǎo)頻信號(hào)成為潛在的干擾源。
在用戶通話紀(jì)錄中,選擇LAST PSMM中非空小區(qū)數(shù)量在4個(gè)以及以上的,并且信號(hào)強(qiáng)度EC/IO在-9db~-14db之間,再按照用戶通話紀(jì)錄所在的柵格標(biāo)識(shí)進(jìn)行分組統(tǒng)計(jì),按照導(dǎo)頻污染紀(jì)錄的條數(shù)按照10-100,100-1000,>1000進(jìn)行柵格渲染。
GIS作為一種呈現(xiàn)和分析手段越來越受到重視,也展現(xiàn)出傳統(tǒng)數(shù)理統(tǒng)計(jì)方法不能比擬的功能和作用。
定位分析、空間分析以及柵格分析都是對(duì)某一時(shí)間點(diǎn)的業(yè)務(wù)數(shù)據(jù)進(jìn)行的靜態(tài)分析方法。未能關(guān)聯(lián)和考慮業(yè)務(wù)數(shù)據(jù)變化的歷史,更無法預(yù)測未來的趨勢(shì)。而時(shí)態(tài)GIS能提供完善的時(shí)序分析功能,高效地回答與時(shí)間相關(guān)的各類問題,在時(shí)間與空間兩方面全面處理地理信息系統(tǒng),是近年來GIS研究領(lǐng)域的熱點(diǎn),隨著時(shí)態(tài)GIS在算法和性能方面的深入研究發(fā)展,相信會(huì)在通話紀(jì)錄分析方面有更廣闊的應(yīng)用空間。
[1] Lucent Technologies.Per Call Measurement Data and Related FeaturesOptional Feature DescriptionRelease 30.0,Issue 13,May 2009.
[2] 沈海濤.CDL在CDMA網(wǎng)絡(luò)優(yōu)化中的應(yīng)用研究[D].上海:上海交通大學(xué),2007:8-9.
[3] Behcet Sarikaya.Geographic Location in the Internet [M].2002:32-34
[4] 張國華,袁亙,羅彩艷.基于CDL的精確定位和網(wǎng)絡(luò)優(yōu)化探討[J].電信科學(xué),2011,6:113-119.
[5] 肖恒輝,林惜斌,李炯城.基于通話記錄的無線定位方法及其應(yīng)用[J].電信科學(xué),2010,7:88-93.
[6] 劉陽,吳章成,辛煒博.通話紀(jì)錄在網(wǎng)絡(luò)運(yùn)營中的應(yīng)用探討[J].中國新通信,2011,13(18):78-93.
[7]譚鈞元,宋國杰,謝昆青.一種有效的基于生活熵的移動(dòng)用戶分類算法[J].計(jì)算機(jī)研究與發(fā)展,2009,46(增刊):433-438.
[8] 劉少華,羅小龍,何幼斌.基于Delauany三角網(wǎng)的泰森多邊形生成算法研究[J].長江大學(xué)學(xué)報(bào)(自科版)理工卷, 2007,4(1):100-103.
[9] 宋捷,曾偉,許強(qiáng).CDMA網(wǎng)絡(luò)的導(dǎo)頻污染問題[J].移動(dòng)通信,2004,2:86-87
GIS Analysis Summary on CDMA Network Call Detailed Log
Wang Zhibo
(China Telecommunication Service Bytemobile Corporation,Shanghai,200050)
Call Detailed Log in CDMA network can provide wireless info,user info and terminal info,.This paper summarythe GIS analysis methods (locating analysis,spatial analysis,and raster analysis) and their application environments.
The user call records;PCMD CDL;temporal GIS
王智博(1981-)男,漢,上海人,工程師,碩士,主要從事軟件開發(fā),項(xiàng)目管理等工作;