徐晶,王西點(diǎn),沈驁,王磊
(中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司,北京 100080)
對(duì)于現(xiàn)代移動(dòng)通信網(wǎng)絡(luò)的建設(shè)和優(yōu)化來(lái)說(shuō),有效地區(qū)分場(chǎng)景是能夠更精確制定規(guī)劃建設(shè)方案、更準(zhǔn)確確定網(wǎng)絡(luò)優(yōu)化策略、實(shí)現(xiàn)精細(xì)化管理和資源有效利用的重要基礎(chǔ)。目前場(chǎng)景劃分的方法主要有兩種,一種是人為劃分場(chǎng)景,一種是智能劃分場(chǎng)景。第一種劃分場(chǎng)景方法是根據(jù)覆蓋等特點(diǎn)人為進(jìn)行劃分,分為室內(nèi)覆蓋場(chǎng)景、室外覆蓋場(chǎng)景、室外移動(dòng)覆蓋場(chǎng)景三大類,進(jìn)而根據(jù)具體地區(qū)話務(wù)特點(diǎn)劃分小類場(chǎng)景。一般來(lái)說(shuō)規(guī)劃建設(shè)方案期間基站的場(chǎng)景已基本設(shè)定,如某基站屬繁華街區(qū)、寫字樓、大型酒店、普通城區(qū)等,主要依賴于網(wǎng)絡(luò)規(guī)劃工程師個(gè)人經(jīng)驗(yàn)的定性判斷,場(chǎng)景粒度較粗。第二種方法是根據(jù)小區(qū)綜合指標(biāo)進(jìn)行智能分析,從多維度屬性定量分析,進(jìn)而識(shí)別小區(qū)場(chǎng)景。由此劃分的小區(qū)場(chǎng)景與所在地理位置基本沒(méi)有聯(lián)系,比如之前設(shè)定為高校場(chǎng)景的小區(qū)和設(shè)定為山區(qū)場(chǎng)景的小區(qū)可能同屬于一個(gè)場(chǎng)景,因?yàn)橛筛黜?xiàng)指標(biāo)分析,它們的網(wǎng)絡(luò)特點(diǎn)相近,可以作為同一類網(wǎng)絡(luò)進(jìn)行優(yōu)化和利用資源。智能分析的方法是建立模型,由模型對(duì)小區(qū)進(jìn)行劃分。首先需確定將小區(qū)聚合為多少場(chǎng)景類別,然后通過(guò)迭代計(jì)算小區(qū)之間各項(xiàng)指標(biāo)的差異度距離,進(jìn)而確定小區(qū)應(yīng)與其他哪些小區(qū)分屬同一類場(chǎng)景。模型的精確度決定著劃分場(chǎng)景是否準(zhǔn)確,因此模型的評(píng)估與優(yōu)化是智能劃分小區(qū)場(chǎng)景的關(guān)鍵。
目前,移動(dòng)通信網(wǎng)絡(luò)的場(chǎng)景劃分主要基于按覆蓋和業(yè)務(wù)等特點(diǎn)根據(jù)經(jīng)驗(yàn)人為配置。這種場(chǎng)景的劃分方法是一種粗粒度的定性的劃分,并不能作為精細(xì)化調(diào)整優(yōu)化的準(zhǔn)確依據(jù),也無(wú)法指導(dǎo)網(wǎng)絡(luò)規(guī)劃建設(shè)和擴(kuò)容調(diào)整。在不同的無(wú)線網(wǎng)絡(luò)特征場(chǎng)景下,網(wǎng)絡(luò)優(yōu)化策略會(huì)不盡相同,往往會(huì)采用不同的優(yōu)化模型。然而,在用這種方法劃分的情況下,同屬于一類場(chǎng)景的小區(qū)其網(wǎng)絡(luò)特征會(huì)存在不同程度的差異。也就是說(shuō),這種粗粒度的定性劃分并不能精確的識(shí)別小區(qū)網(wǎng)絡(luò)特征。
智能識(shí)別小區(qū)場(chǎng)景的方法能夠綜合考慮多項(xiàng)業(yè)務(wù)指標(biāo)間的關(guān)聯(lián),并且可以從多維度定量地分析小區(qū)的網(wǎng)絡(luò)特征。雖然現(xiàn)階段這種方法并沒(méi)有在各省移動(dòng)運(yùn)營(yíng)商中廣泛應(yīng)用,但隨著網(wǎng)絡(luò)規(guī)模的擴(kuò)大和多種網(wǎng)絡(luò)制式組網(wǎng)的日趨復(fù)雜,會(huì)有越來(lái)越多運(yùn)營(yíng)商選擇運(yùn)用海量數(shù)據(jù)來(lái)智能劃分場(chǎng)景。這種劃分方法是否可以準(zhǔn)確的給出具有相同網(wǎng)絡(luò)特征的場(chǎng)景分類,很大程度上取決于智能分析模型的準(zhǔn)確度。雖然此種劃分方法在精細(xì)化劃分場(chǎng)景方面有著顯著優(yōu)勢(shì),但目前仍存在一些問(wèn)題。首先,在劃分小區(qū)場(chǎng)景時(shí)無(wú)法提前給出應(yīng)聚合為多少類場(chǎng)景。場(chǎng)景類數(shù)過(guò)多或過(guò)少都會(huì)導(dǎo)致類別冗余度高,場(chǎng)景網(wǎng)絡(luò)特征不明顯。其次,在考慮各項(xiàng)指標(biāo)時(shí),不區(qū)分指標(biāo)的重要度,不能有效的聚合小區(qū)場(chǎng)景。另外,聚合出小區(qū)場(chǎng)景類別后,沒(méi)有具體指明每一類小區(qū)場(chǎng)景的網(wǎng)絡(luò)特征。
由此,要實(shí)現(xiàn)精細(xì)化劃分小區(qū)場(chǎng)景,需要綜合考慮多項(xiàng)網(wǎng)絡(luò)指標(biāo),然而人工分析無(wú)法全面衡量多項(xiàng)指標(biāo),只能依靠智能模型劃分場(chǎng)景。因此,提升場(chǎng)景智能劃分方法的準(zhǔn)確度是非常必要的。
網(wǎng)絡(luò)規(guī)劃優(yōu)化中將智能劃分場(chǎng)景的方法應(yīng)用到實(shí)際工作中,一是需要提高場(chǎng)景劃分準(zhǔn)確度,二是要能夠有高效的手段判斷出小區(qū)場(chǎng)景類的網(wǎng)絡(luò)特征。
本文提出了一種能夠有效提升場(chǎng)景智能劃分準(zhǔn)確度的方法,并且能夠評(píng)估劃分出的場(chǎng)景具有的實(shí)際網(wǎng)絡(luò)特征。第一,通過(guò)區(qū)分各項(xiàng)指標(biāo)的重要度得到指標(biāo)權(quán)重,在計(jì)算小區(qū)間差異度距離并對(duì)小區(qū)進(jìn)行聚合分類處理時(shí)引入指標(biāo)的權(quán)重。第二,通過(guò)二分聚類來(lái)確定小區(qū)集合應(yīng)被聚合成多少類場(chǎng)景。第三,得到場(chǎng)景類別后利用概率的平方差來(lái)評(píng)估場(chǎng)景的網(wǎng)絡(luò)特征。
2.1.1 指標(biāo)均方差加權(quán)
在綜合考慮各項(xiàng)指標(biāo)的基礎(chǔ)上,對(duì)指標(biāo)進(jìn)一步分析,從而得到指標(biāo)的權(quán)重。不同指標(biāo)在表明小區(qū)網(wǎng)絡(luò)特征時(shí),其波動(dòng)的活躍度不同。比如覆蓋率是表明小區(qū)場(chǎng)景的一個(gè)重要指標(biāo),那么覆蓋率的權(quán)重值會(huì)高于其他指標(biāo)。為了確定哪些指標(biāo)在表明場(chǎng)景網(wǎng)絡(luò)特征上更為重要,對(duì)各項(xiàng)指標(biāo)采取求均方差的方法進(jìn)行處理。因?yàn)榫讲钍呛饬繕颖静▌?dòng)大小的量,均方差越大,說(shuō)明該指標(biāo)在不同小區(qū)中取值變化越大,也就越為重要。
設(shè)指標(biāo)集A={ai|i=1,2,…,n},n為指標(biāo)數(shù)量。設(shè)指標(biāo)ai的取值集合為Vi={vij|j=1,2,…,m},m表示指標(biāo)ai取值情況有m種。每個(gè)小區(qū)可以表示為一個(gè)n維向量,每一維度代表一個(gè)指標(biāo)的值。
指標(biāo)ai的均方差表示為公式(1):

其中μi是ai的平均值。
在計(jì)算出各指標(biāo)的均方差后,對(duì)各指標(biāo)的均方差進(jìn)行歸一化,進(jìn)而得到相應(yīng)的指標(biāo)權(quán)重。通過(guò)加權(quán)可以更準(zhǔn)確反映場(chǎng)景類內(nèi)小區(qū)的相似度,得到更佳的場(chǎng)景分類。
2.1.2 二分聚類確定場(chǎng)景類別
由于在分析全網(wǎng)或某一地市小區(qū)集合時(shí),無(wú)法確定小區(qū)應(yīng)該分屬于多少個(gè)場(chǎng)景類別。本文提出了二分聚類的方法解決場(chǎng)景類別數(shù)量初始值設(shè)置的問(wèn)題。
首先,設(shè)置初始類別個(gè)數(shù)k=2,選擇兩個(gè)中心點(diǎn)對(duì)小區(qū)集合進(jìn)行聚類處理。對(duì)得到的兩個(gè)場(chǎng)景類別進(jìn)行評(píng)估,如果評(píng)估結(jié)果是分類需要保留,則對(duì)兩個(gè)子小區(qū)場(chǎng)景類的小區(qū)集合分別繼續(xù)進(jìn)行二分聚類處理,直到子場(chǎng)景類的二分聚類分裂結(jié)果不再需要保留為止。
在判斷子場(chǎng)景二分聚類處理是否需要保留時(shí),采用的方法是最短描述長(zhǎng)度(MDL)原理。該方法得到兩個(gè)信息,一個(gè)信息是新的兩個(gè)場(chǎng)景類別中心與各自類中每個(gè)小區(qū)之間關(guān)系所需的信息,記為S1,一個(gè)信息是兩個(gè)場(chǎng)景二分聚類分裂之前原場(chǎng)景中心與所有小區(qū)之間關(guān)系所需的信息,記為S2。如果S1>S2,則說(shuō)明本次二分聚類不需要保留,此方法舉例如圖1。現(xiàn)在需對(duì)小區(qū)集合進(jìn)行場(chǎng)景劃分。
第一次二分聚類得到場(chǎng)景包括小區(qū)集合A、小區(qū)集合B,評(píng)估后可知第一次的場(chǎng)景分裂需要保留。

圖1 二分聚類判斷場(chǎng)景類別的舉例
第二次分別對(duì)集合A、集合B進(jìn)行二分聚類處理,并對(duì)分裂進(jìn)行評(píng)估。評(píng)估結(jié)果集合A的場(chǎng)景分裂需要保留,集合B分裂后其所需信息量大于分裂前,因此停止對(duì)集合B的處理,并將集合B作為一類場(chǎng)景。
第三次對(duì)集合A分裂得到的子集合AA、AB進(jìn)行二分聚類處理及評(píng)估。評(píng)估結(jié)果集合AA的分類需保留,集合AB分裂需終止,將AB作為一類場(chǎng)景。
第四次對(duì)集合AA分裂得到的子集合AAA、AAB進(jìn)行二分聚類處理及評(píng)估。評(píng)估結(jié)果集合AAA、AAB的分裂需終止,并作為最終場(chǎng)景類。
因此小區(qū)集合最終被最大程度聚合為四類場(chǎng)景,分別是B、AB、AAA、AAB。
2.1.3 概率方差確定場(chǎng)景的網(wǎng)絡(luò)特征
本文通過(guò)量化的方法歸納并呈現(xiàn)場(chǎng)景類別的網(wǎng)絡(luò)特征。主要方法是計(jì)算各項(xiàng)指標(biāo)的概率并進(jìn)行比較,根據(jù)概率的比較結(jié)果得出網(wǎng)絡(luò)特征。場(chǎng)景Cl中的某個(gè)小區(qū)因?yàn)橐芽紤]小區(qū)所在的場(chǎng)景類,所以在評(píng)估該小區(qū)指標(biāo)ai取值為vij的概率時(shí),相對(duì)于概率P[ai=vij]來(lái)說(shuō)P[ai=vij|Cl]的概率應(yīng)該更大。各項(xiàng)指標(biāo)的概率情況會(huì)有不同, P[ai=vij|Cl]較P[ai=vij]越大,則說(shuō)明此類場(chǎng)景中該項(xiàng)指標(biāo)的特征越明顯。為了更好的顯示各項(xiàng)指標(biāo)概率的情況,用平方的差來(lái)計(jì)算P[ai=vij|C1]和P[ai=vij]的相差程度,設(shè)相差程度為U,則指標(biāo)ai的概率相差程度定義見(jiàn)公式(2):

通過(guò)計(jì)算概率相差度可以量化的呈現(xiàn)各類場(chǎng)景的指標(biāo)特征,綜合概率相差度最高和最低的指標(biāo),可以得到較為準(zhǔn)確的場(chǎng)景網(wǎng)絡(luò)特征。
以上幾種技術(shù)從3方面分別改進(jìn)了智能劃分話務(wù)小區(qū)場(chǎng)景的方法。為了能夠使3種技術(shù)系統(tǒng)地結(jié)合,本文設(shè)計(jì)了實(shí)施流程見(jiàn)圖2。
技術(shù)的實(shí)施首先對(duì)選定的小區(qū)集進(jìn)行指標(biāo)加權(quán),可以充分考慮各項(xiàng)指標(biāo)的重要度。然后通過(guò)二分聚類來(lái)確定小區(qū)集合應(yīng)被聚合成多少類場(chǎng)景。在得到場(chǎng)景類別后,用常規(guī)聚類分析方法對(duì)小區(qū)集進(jìn)行處理,得到各類小區(qū)集合。最后利用概率的平方差來(lái)量化地呈現(xiàn)場(chǎng)景的網(wǎng)絡(luò)特征,從而指導(dǎo)制定優(yōu)化方案。

圖2 實(shí)施流程圖
本文結(jié)合智能劃分場(chǎng)景方法的不足之處,提出了指標(biāo)均方差加權(quán)、二分聚類確定場(chǎng)景類別、概率方差確定場(chǎng)景特性3種技術(shù)加以改善。優(yōu)勢(shì)在于能夠分重要級(jí)別考慮場(chǎng)景劃分的依據(jù),能夠明確全網(wǎng)小區(qū)場(chǎng)景可分幾類,能夠細(xì)分出場(chǎng)景的特征,有針對(duì)性的采取優(yōu)化措施。但由于該方法目前在現(xiàn)網(wǎng)中應(yīng)用較少,在小區(qū)數(shù)據(jù)處理操作上積累的經(jīng)驗(yàn)方法較少,因此后續(xù)更多需要圍繞現(xiàn)網(wǎng)數(shù)據(jù)開(kāi)展大量的驗(yàn)證和實(shí)踐工作,并進(jìn)一步提升話務(wù)場(chǎng)景劃分的效率和準(zhǔn)確率,更好的指導(dǎo)現(xiàn)網(wǎng)優(yōu)化工作。
[1]李軍,劉匡虎.一種現(xiàn)代移動(dòng)通信網(wǎng)絡(luò)話務(wù)場(chǎng)景劃分方法[J],移動(dòng)通信, 2012(9).
[2]韓斌杰, 杜新顏, 張建斌.GSM原理及其網(wǎng)絡(luò)優(yōu)化[M].北京:機(jī)械工業(yè)出版社,2010.
[3]岳士宏,王正友.二分網(wǎng)格聚類方法及有效性[J].計(jì)算機(jī)研究與發(fā)展,2005,42(9):1505-1510.
[4]Jiawei Han, Micheline Kamber.數(shù)據(jù)挖掘概念與技術(shù)[M].范明,孟小峰,譯.北京:機(jī)械工業(yè)出版社, 2007.
[5]謝邦昌.數(shù)據(jù)挖掘Clementine應(yīng)用實(shí)務(wù)[M].北京:機(jī)械工業(yè)出版社,2008.