陳向榮
(中國(guó)移動(dòng)通信集團(tuán)福建有限公司,福建 福州 350001)
隨著移動(dòng)互聯(lián)網(wǎng)的高速發(fā)展,通過(guò)移動(dòng)蜂窩網(wǎng)絡(luò)接入互聯(lián)網(wǎng)的用戶(hù)數(shù)持續(xù)增長(zhǎng),用戶(hù)對(duì)移動(dòng)網(wǎng)絡(luò)的需求日益增大,訪問(wèn)網(wǎng)絡(luò)的數(shù)據(jù)量也隨之高速增長(zhǎng),而且用戶(hù)對(duì)網(wǎng)絡(luò)質(zhì)量的要求逐步提升。保障一個(gè)良好的網(wǎng)絡(luò)環(huán)境,提高用戶(hù)使用感知,成為移動(dòng)網(wǎng)絡(luò)優(yōu)化工作的重中之重,這給網(wǎng)絡(luò)優(yōu)化的工作效率和質(zhì)量的保證帶來(lái)了巨大的挑戰(zhàn)。在移動(dòng)網(wǎng)絡(luò)優(yōu)化工作中,天線方位角的嚴(yán)重偏差將會(huì)很大程度上影響到網(wǎng)絡(luò)優(yōu)化效果和網(wǎng)絡(luò)服務(wù)質(zhì)量,作為日常網(wǎng)絡(luò)優(yōu)化基礎(chǔ)數(shù)據(jù)的天線方位角,其準(zhǔn)確性與否將直接導(dǎo)致網(wǎng)絡(luò)優(yōu)化質(zhì)量的好壞。
當(dāng)前,天線工參的數(shù)據(jù)大多依賴(lài)人工通過(guò)羅盤(pán)、坡度儀等工具進(jìn)行測(cè)量,數(shù)據(jù)的準(zhǔn)確性與工作人員的測(cè)量技術(shù)的熟練度和細(xì)心程度有很大的關(guān)系,時(shí)常出現(xiàn)數(shù)據(jù)的漏報(bào)和誤報(bào)情況。過(guò)分依賴(lài)人工的檢測(cè),既無(wú)法保障測(cè)量數(shù)據(jù)的實(shí)時(shí)性,測(cè)量效率也很低。天線方位角作為天線工參中極為重要的一部分信息,核查的方法主要是通過(guò)工程優(yōu)化人員到達(dá)基站現(xiàn)場(chǎng),利用指南針貼近天線下沿進(jìn)行方位角讀取測(cè)量并手工記錄,同時(shí),結(jié)合室外天線、RRU(ra2io remote unit)和室內(nèi)BBU(base ban2 unit)的線纜連接查詢(xún),最終完成小區(qū)的天線覆蓋方向確認(rèn),而對(duì)于鐵塔和壁掛類(lèi)型的天線方位角的測(cè)量,則由持有登高證的工作人員對(duì)天線方位角進(jìn)行確認(rèn),由此,天線方位角的測(cè)量和確認(rèn)工作需要投入大量的人工成本,且數(shù)據(jù)的準(zhǔn)確性和及時(shí)性無(wú)法保障。隨著網(wǎng)絡(luò)規(guī)模的日益增大以及多制式多頻段多層網(wǎng)絡(luò)的出現(xiàn),持有登高證的工作人員核查天線方位角的工作量急劇增加,人工測(cè)量的方法已極大地影響網(wǎng)絡(luò)維護(hù)、網(wǎng)絡(luò)優(yōu)化等工作的效率及質(zhì)量,進(jìn)而降低了用戶(hù)使用網(wǎng)絡(luò)感知,也增加了用戶(hù)的投訴概率。如何利用大數(shù)據(jù)挖掘技術(shù)手段,實(shí)現(xiàn)天線方位角自動(dòng)采集及異常預(yù)警,是當(dāng)下亟須解決的問(wèn)題。
多層感知機(jī)最主要的特點(diǎn)是有多個(gè)神經(jīng)元層,因此也叫深度神經(jīng)網(wǎng)絡(luò)(2eep neural network,DNN)。第一層稱(chēng)為輸入層,最后一層稱(chēng)為輸出層,中間層稱(chēng)為隱層,其中,隱層的數(shù)量和輸出神經(jīng)元的個(gè)數(shù)可根據(jù)具體應(yīng)用進(jìn)行選擇。3 層感知機(jī)的網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。

圖1 3 層感知機(jī)的網(wǎng)絡(luò)結(jié)構(gòu)

前向傳播即網(wǎng)絡(luò)處于學(xué)習(xí)階段,其學(xué)習(xí)過(guò)程為:首先,根據(jù)當(dāng)前各層的權(quán)向量的值,對(duì)每個(gè)樣本(即輸入)作前向計(jì)算;然后,計(jì)算該網(wǎng)絡(luò)的輸出結(jié)果與期望值的差值,并與限定值進(jìn)行比較,若小于限定值,則學(xué)習(xí)過(guò)程結(jié)束,否則反向傳播逐層調(diào)整權(quán)向量值的大小,直到差值小于限定值。由此,多層感知機(jī)神經(jīng)網(wǎng)絡(luò)有以下幾個(gè)優(yōu)點(diǎn):
? 對(duì)于具有高度非線性的問(wèn)題,多層感知機(jī)神經(jīng)網(wǎng)絡(luò)能夠以任意精度逼近任何非線性連續(xù)函數(shù);
? 具有很強(qiáng)的容錯(cuò)性和很快的處理速度,因?yàn)樵谏窠?jīng)網(wǎng)絡(luò)中信息是分布存儲(chǔ)和并行處理的;
? 具有較好的泛化能力,因?yàn)樯窠?jīng)網(wǎng)絡(luò)在訓(xùn)練時(shí),可以從輸入和輸出的數(shù)據(jù)中發(fā)現(xiàn)規(guī)律性的特征,并逐層調(diào)整各權(quán)值大小,具有較強(qiáng)的自學(xué)習(xí)和自適應(yīng)能力;
? 具有較強(qiáng)的數(shù)據(jù)融合能力,多層感知機(jī)神經(jīng)網(wǎng)絡(luò)可以同時(shí)處理定量特征變量和定性特征變量;
? 無(wú)須考慮各個(gè)子系統(tǒng)間的解耦問(wèn)題,MLP神經(jīng)網(wǎng)絡(luò)并沒(méi)有明確限定隱層的數(shù)量和輸出層神經(jīng)元的個(gè)數(shù),可根據(jù)實(shí)際應(yīng)用選擇相應(yīng)的層數(shù)和輸出層神經(jīng)元的個(gè)數(shù),因此對(duì)于單變量系統(tǒng)和多變量系統(tǒng)有通用的描述方式。
(2)促凝增強(qiáng)劑投加量的確定。取3號(hào)樣品加入AP2.0%、水泥20.0%及相應(yīng)添加劑,CA投加量不同,考察固化改良后浸出液主要指標(biāo),試驗(yàn)結(jié)果見(jiàn)表7。通過(guò)數(shù)據(jù)分析可以看出,當(dāng)CA加量達(dá)到5.0%時(shí),改良固化后的COD值較低47.5mg/L、抗壓強(qiáng)度較高,達(dá)到1.76MPa。再增加加量固化效果變化不大,因此選擇CA投加量為5.0%。
BP 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程由信號(hào)的正向傳播過(guò)程與誤差的反向傳播過(guò)程組成。正向傳播過(guò)程是輸入信號(hào)通過(guò)隱層和輸出層節(jié)點(diǎn)的處理計(jì)算得到的網(wǎng)絡(luò)實(shí)際輸出值進(jìn)一步與期望輸出值進(jìn)行對(duì)比,計(jì)算它們的差值,將其作為誤差,若誤差不在限定范圍內(nèi),則轉(zhuǎn)入學(xué)習(xí)過(guò)程的另一個(gè)階段,即誤差的反向傳播過(guò)程。誤差的反向傳播過(guò)程是指將計(jì)算的誤差通過(guò)隱層向輸入層逐層地進(jìn)行反傳,并將誤差分?jǐn)偨o各層的所有單元,以此作為調(diào)整各層權(quán)向量的值的根據(jù),并反復(fù)地進(jìn)行該過(guò)程。各層權(quán)向量的值不斷修正的過(guò)程,即BP 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程。在輸出的誤差值減小到限定范圍內(nèi)或迭代的次數(shù)達(dá)到限定學(xué)習(xí)的次數(shù)時(shí),BP 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程將會(huì)停止。
由此,BP 神經(jīng)網(wǎng)絡(luò)算法是把樣本集學(xué)習(xí)與訓(xùn)練的問(wèn)題轉(zhuǎn)化為代價(jià)函數(shù)的無(wú)約束最優(yōu)化問(wèn)題。對(duì)于本文的3 層感知機(jī)網(wǎng)絡(luò),設(shè)該網(wǎng)絡(luò)從(P+ 1)維輸入空間RP+1到L維輸出空間RL的非線性映射為:G:y=g(x),其中x=[x1,x2, …,xP]T為擴(kuò)展的輸入向量,y=[y1,y2, …,yL]T為輸出向量。圖1中的3 層感知機(jī)網(wǎng)絡(luò)所對(duì)應(yīng)的非線性映射G可收斂于在閉區(qū)間內(nèi)的連續(xù)函數(shù)或非線性映射,這在參考文獻(xiàn)[18-19]中得到了證明。假定訓(xùn)練樣本集則感知機(jī)網(wǎng)絡(luò)對(duì)該訓(xùn)練樣本集進(jìn)行學(xué)習(xí),即尋找最優(yōu)的各層網(wǎng)絡(luò)權(quán)值,且在一定代價(jià)函數(shù)的條件下,非線性映射G是映射M的最優(yōu)逼近,常用的代價(jià)函數(shù)表達(dá)式如下:

則上述最優(yōu)化問(wèn)題為:求使得代價(jià)函數(shù)到最小所對(duì)應(yīng)的最優(yōu)權(quán)向量ωopt和υopt的值,即:

對(duì)于3 層感知機(jī)網(wǎng)絡(luò)的隱層網(wǎng)絡(luò),一般采用SBPM 算法調(diào)整權(quán)值。對(duì)于輸出層網(wǎng)絡(luò),本文采用Kalman 濾波算法[20-21]調(diào)整權(quán)值。
BP 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程主要有4 個(gè)步驟。
步驟1組成輸入模式并由輸入層通過(guò)隱層向輸出層的正向傳播過(guò)程,即BP 神經(jīng)網(wǎng)絡(luò)中的正向傳播的過(guò)程。
步驟2計(jì)算網(wǎng)絡(luò)實(shí)際輸出值與期望值的差值,并作為誤差,若誤差不在限定范圍內(nèi),則誤差信號(hào)由輸出層通過(guò)隱層向輸入層逐層反向傳播,從而調(diào)整各層權(quán)值的“誤差反向傳播”過(guò)程。
步驟3由“正向傳播”與“誤差反向傳播”反復(fù)進(jìn)行的網(wǎng)絡(luò)“記憶訓(xùn)練”過(guò)程。該過(guò)程主要是不斷更新各層權(quán)向量,直到找到最優(yōu)權(quán)向量ωopt和υopt的值。
步驟4網(wǎng)絡(luò)趨向收斂即網(wǎng)絡(luò)的總體誤差趨向極小值的“學(xué)習(xí)收斂”過(guò)程。
在訓(xùn)練階段中,訓(xùn)練實(shí)例重復(fù)通過(guò)網(wǎng)絡(luò),同時(shí)修正各個(gè)權(quán)值,改變各層權(quán)值的目的是最小化訓(xùn)練集誤差。繼續(xù)網(wǎng)絡(luò)訓(xùn)練直到此過(guò)程一直進(jìn)行到網(wǎng)絡(luò)輸出的誤差值減小到限定范圍內(nèi)或迭代的次數(shù)達(dá)到限定學(xué)習(xí)的次數(shù)時(shí)停止訓(xùn)練。因此,訓(xùn)練的終止條件可以為使網(wǎng)絡(luò)收斂到最小的誤差,也可以是設(shè)定的最大重復(fù)次數(shù)。本文BP 算法的具體流程如圖2 所示。

圖2 BP 算法流程
本文針對(duì)東南某省份2018 年1 月—6 月的OTT 數(shù)據(jù)和實(shí)際測(cè)量的天線方位角進(jìn)行訓(xùn)練和測(cè)試,共計(jì)26 854 條數(shù)據(jù)。首先利用測(cè)量的方位角值將方位角方向劃分為12 個(gè)區(qū)間,每個(gè)區(qū)間覆蓋30°范圍,進(jìn)而構(gòu)建分類(lèi)標(biāo)簽;然后對(duì)數(shù)據(jù)進(jìn)行柵格化處理;為了驗(yàn)證模型的預(yù)測(cè)效果,將數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集兩部分,其中訓(xùn)練集數(shù)據(jù)占比70%,共計(jì)18 798 條數(shù)據(jù)。最后,利用多層感知機(jī)深度神經(jīng)網(wǎng)絡(luò)算法,對(duì)訓(xùn)練數(shù)據(jù)集構(gòu)建模型,并對(duì)測(cè)試集的方位角的方向類(lèi)別進(jìn)行分類(lèi)預(yù)測(cè)。將預(yù)測(cè)結(jié)果與真實(shí)標(biāo)簽進(jìn)行對(duì)比驗(yàn)證,評(píng)估模型效果。本文基于多層感知機(jī)的神經(jīng)網(wǎng)絡(luò)的天線方位角診斷流程如圖3 所示。
每個(gè)小區(qū)的OTT 特征數(shù)據(jù)存在一定的差異性,其值的大小范圍并不完全相同,且有的小區(qū)上報(bào)的采樣點(diǎn)數(shù)量較多,有的則較少。為了能夠?qū)⒚總€(gè)小區(qū)的特征數(shù)據(jù)轉(zhuǎn)化為一條訓(xùn)練數(shù)據(jù),則需要對(duì)每個(gè)小區(qū)的數(shù)據(jù)進(jìn)行處理。首先對(duì)于各小區(qū)OTT 數(shù)據(jù)特征中和正常數(shù)據(jù)差別很大的少量異常數(shù)據(jù),利用孤立森林(isolation forest,IF)算法進(jìn)行識(shí)別并剔除;然后以小區(qū)經(jīng)緯度為中心點(diǎn)構(gòu)建大柵格,以距離小區(qū)經(jīng)度或緯度的最大距離乘以2 作為大柵格的長(zhǎng)度。對(duì)于每個(gè)小區(qū)900 個(gè)特征變量(不包含標(biāo)簽字段)的一條數(shù)據(jù), 即30×30 的柵格,也可以看作大小為30×30 的圖像。將大柵格按照30×30 劃分成一個(gè)個(gè)小的柵格,并給每個(gè)柵格填充此柵格中分布采樣點(diǎn)的RSRP 平均值,由于每個(gè)小區(qū)的RSRP 峰值并不相等,所以本文不采用常規(guī)的歸一化方法,而是對(duì)每個(gè)小區(qū)單獨(dú)進(jìn)行處理。針對(duì)每個(gè)小區(qū)的柵格數(shù)據(jù),將每個(gè)柵格的平均RSRP,除以最大的柵格平均RSRP,將柵格列表中的平均電平值數(shù)據(jù)單獨(dú)取出,并組成向量,在900 個(gè)柵格中, 發(fā)現(xiàn)共有87個(gè)柵格有采樣點(diǎn)分布。由于神經(jīng)網(wǎng)絡(luò)激活函數(shù)對(duì)處理數(shù)據(jù)的范圍有要求,且在梯度下降的過(guò)程中,如果每個(gè)維度的數(shù)據(jù)分布不同,使用相同的學(xué)習(xí)率很難迭代到最優(yōu)值。因此本文將柵格化的數(shù)據(jù)進(jìn)行了歸一化處理。
對(duì)于標(biāo)簽變量,本文將小區(qū)工參中的方位角按照正北方向?yàn)?°,并以順時(shí)針?lè)较蛴?jì)算,對(duì)方位角方向劃分為12 個(gè)區(qū)間,每個(gè)區(qū)間覆蓋30°范圍,即“0”表示[0, 30°),“1”表示[30°, 60°),…,“11”表示[330°, 360°),以此構(gòu)建天線方位角分類(lèi)標(biāo)簽。數(shù)據(jù)預(yù)處理流程如圖4 所示。

圖3 基于多層感知機(jī)的神經(jīng)網(wǎng)絡(luò)的天線方位角診斷流程

圖4 數(shù)據(jù)預(yù)處理流程
本文基于預(yù)處理后的訓(xùn)練數(shù)據(jù)集利用多層感知機(jī)的反向傳播算法構(gòu)建天方位角診斷模型,并對(duì)測(cè)試數(shù)據(jù)集進(jìn)行分類(lèi)預(yù)測(cè),得到準(zhǔn)確率為92.6%,分類(lèi)準(zhǔn)確性較高。為了與本文基于多層感知機(jī)模型的天線方位角分類(lèi)效果進(jìn)行對(duì)比,這里還分別利用了常用的分類(lèi)算法隨機(jī)森林和邏輯回歸兩種算法對(duì)相同的數(shù)據(jù)集進(jìn)行訓(xùn)練和測(cè)試,得到準(zhǔn)確率分別為68.7%和73.4%。為了更清晰地了解12 類(lèi)方位角基于多層感知機(jī)模型的預(yù)測(cè)效果,本文利用混淆矩陣計(jì)算各類(lèi)別的查準(zhǔn)率(Precision)、查全率(Recall)以及F1 得分(F1-score),從而對(duì)基于多層感知機(jī)深度神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)的每類(lèi)的結(jié)果進(jìn)行了評(píng)估。評(píng)估結(jié)果見(jiàn)表1。

表1 基于多層感知機(jī)的天線方位角預(yù)測(cè)的評(píng)價(jià)指標(biāo)
其中,查準(zhǔn)率Precision = TP/(TP+FP),TP 表示真正例,即被模型預(yù)測(cè)為正的正樣本,F(xiàn)P 表示假正例,即被模型預(yù)測(cè)為正的負(fù)樣本,查全率Recall = TP/(TP+FN),F(xiàn)N 表示假負(fù)例,即被模型預(yù)測(cè)為負(fù)的正樣本,F(xiàn)1 得分F-score =2×Precision×Recall /(Precision + Recall)。
由表1 可知,將天線方位角分為12 個(gè)區(qū)間,并利用多層感知機(jī)深度神經(jīng)網(wǎng)絡(luò)算法,對(duì)方位角進(jìn)行診斷預(yù)測(cè),整體效果較好,其中預(yù)測(cè)最差的類(lèi)別為5(即方位角區(qū)間為[150,180°)),準(zhǔn)確率為88.91%,召回率為80.33%,F(xiàn)1 得分為0.844 0,召回率略低,但比隨機(jī)森林和邏輯回歸兩種算法的整體準(zhǔn)確率都要高很多,預(yù)測(cè)最好的類(lèi)別為10(即方位角區(qū)間為[300, 330°)),準(zhǔn)確率為97.03%,召回率為95.89%,F(xiàn)1 得分為0.964 6。
本文基于多層感知機(jī)深度神經(jīng)網(wǎng)絡(luò)的方法對(duì)天線方位角的范圍進(jìn)行分類(lèi)判別,分類(lèi)準(zhǔn)確率較高。結(jié)果表明,將天線方位角分為12 個(gè)類(lèi)別,利用多層感知機(jī)的模型能夠精準(zhǔn)地預(yù)測(cè)天線方位角的范圍類(lèi)別。該方法已在東南某省份大數(shù)據(jù)平臺(tái)上完成部署,并對(duì)現(xiàn)網(wǎng)的天線方位角進(jìn)行診斷,取得了較好成果,該方法能夠快速精準(zhǔn)地識(shí)別異常天線方位角范圍,為無(wú)線網(wǎng)絡(luò)優(yōu)化工作提供了有效的數(shù)據(jù)支撐。
為了更精準(zhǔn)地核查效果,下一步將針對(duì)天線方向角的合理性給出建議值,在判斷天線方位角是否偏移的同時(shí)考慮判斷天線俯仰角是否偏移。