周智洪,沙勝
(中國移動通信集團廣東有限公司東莞分公司,廣東 東莞 523129)
為了更好地提升語音質量,2014年廣東移動新增GSM上下行質差話務比例考核指標,為全網所有小區六忙時MR測量報告樣本總和中Rxquality 6、7級樣本的占比,占公司經營業績考核5分。雖然東莞分公司的上下行質差話務比例指標在一類地市最好,但是在全省排名靠后。由于上下行質差話務比例指標一直居高不下,嚴重影響客戶感知,為了更好地優化上下行質差話務比例指標,亟需研究和建立上下行質差話務比例量化與預測模型,用于后續指導質差專項整治工作。考慮到上下行質差話務比例受新建宏站、基站停閉、天線調整、私裝等眾多因素的影響,包含確定性因素與不確定性因素,具有非線性的特征,利用BP神經網絡算法搭建復雜因素的質差量化與預測數學模型,為后續網絡優化工作提供理論依據。
BP(Back Propagation)網絡是神經網絡中的一種典型結構,其具有分層結構,信息從輸入層進入網絡,逐層向前傳遞至輸出層。根據神經元轉移函數、隱層數以及權值調整規則的不同,可以形成具有各種功能特點的神經網絡。BP神經網絡模型拓撲結構包括輸入層(input)、隱層(hide layer)和輸出層(output layer),學習過程通過信號的正向傳播與誤差的反向傳播來不斷調整權值和閾值,此過程一直進行到網絡輸出的誤差減少到可接受的程度。隨著學習過程的進行,該網絡對已經結果的復制會變得越來越準確,一旦訓練完畢,就可以將神經網絡應用到未來結果的未來案例中。
BP神經網絡模型如圖1所示:

圖1 BP神經網絡模型
神經網絡可以近似多種預測模型,而對模型結構和假設只有最小需求,關系形式在學習過程中確定。如果目標與預測變量間的線性關系適當,則神經網絡結果會非常接近傳統線性模型的結果;如果非線性關系更為適當,則神經網絡會自動接近“正確”的模型結果。利用神經網絡的這些功能特點,可以建立質差預測模型。下面使用專業數據分析工具SPSS Modeler軟件提供的自動建模工具(神經網絡算法)進行質差預測建模,如圖2所示。

圖2 建模工具
神經網絡輸入與輸出變量的選擇是模型設計和訓練的基礎,數據選擇的合理性對模型設計精度與準確性十分重要。輸出變量的選擇相對容易,是一個或多個預測變量的值;而輸入變量則必須選擇那些對輸出影響大且能夠檢測或提取的變量,此外還要求各輸入變量之間互不相關或相關性很小,使其具有能用期望精度的數學函數來擬合輸入輸出之間的映射關系。
根據協議規定,質差采樣點與C/I關系對照表如表1所示,C/I低是產生質差采樣點的根本原因。目前集團公司定義6、7級屬于高質差,因此C/I<9dB時滿足不了用戶正常通話,將產生質差。

表1 質差采樣點與C/I關系對照表
根據C/I的定義,當有用信號C過小或者噪聲I過大時將產生質差,究其原因分為3類:弱覆蓋、干擾、硬件故障。針對這3類主要影響因素,采用因素分析法深入挖掘、細化每項影響因素,逐一篩選作為質差建模的輸入與輸出變量。 質差話務比例影響因素思維導圖如圖3所示。
數據的標準化是將數據按比例縮放,使之落入一個小的特定區間,去除數據的單位限制,將其轉化為無量綱的純數值,便于不同單位或量級的指標能夠進行比較和加權。

圖3 質差話務比例影響因素思維導圖
進行數據標準化的原因主要如下:
(1)神經網絡的輸入數據具有不同的物理意義和量綱,數據標準化可消除量綱的影響,使網絡的輸入與輸出變量處于同樣重要的地位,輸入變量的重要性由模型自行計算確定。
(2)神經網絡的轉移函數均采用softmax、雙曲正切或sigmoid函數,其取值范圍為[-1,1],輸入數據標準化處理可防止因輸入飽和而使得神經網絡的泛化能力下降。
對輸入輸出向量進行歸一化處理,將輸入值處理到(0,1)區間內。如輸入變量天線調整數量,標準化為:Ai=((Ai-Amin)/(Amax-Amin)),A 代表柵格內天線調整數量。
針對不同的應用適宜采用不同的神經網絡,模型選擇的任務是根據給定數據建立一個具有最優復雜度的模型。隱藏層包含無法觀察的網絡節點,每個隱藏單位是一個輸入權重總和的函數,該函數是激活函數,而且權重值由估計算法確定。如果網絡包含第2個隱藏層,則第2個隱藏層中的每個隱藏單位是第1個隱藏層中權重之和的函數。
隱節點的作用是從樣本中提取并存儲其內在的規律,設置多少個隱節點取決于訓練樣本數的多少、樣本噪聲的大小以及樣本中蘊含規律的復雜程度。對于質差預測問題,可以看作是一個影響因素到質差話務比例指標值之間的非線性映射。由于一個3層BP網絡可以以任意精度去逼近任意映射關系,因此本例采用3層BP網絡結構。隱含節點數的選擇是神經網絡設計較為關鍵的一步,其直接關系到網絡的復雜程度與泛化能力。采用試湊法確定最佳隱節點數,用樣本集進行訓練,從中確定網絡誤差最小時的隱節點數為12。
網絡設計完成后,經訓練與學習后的預測模型是否能對未在訓練集中出現的樣本做出正確反映的能力是評判網絡性能好壞的唯一標準。而對神經網絡性能好壞的檢測要用訓練樣本集以外的數據,即新鮮樣本集,如果神經網絡通過對已有樣本學習后能夠對新的樣本集做出準確預測,則說明模型泛化能力較強,達到模型與預期效果。BP網絡泛化能力如圖4所示:

圖4 BP網絡泛化能力
經過對模型進行訓練與學習,柵格質差預測值落入真實值正態分布區間(μ-1.96σ,μ+1.96σ)范圍內認為預測準確,上下行質差話務比例模型準確性為91.2%。質差話務比例模型準確性如圖5所示。
(1)通過BP神經網絡對質差預測的方法是切實可行的,神經網絡具有高度魯棒性和容錯性,且具有充分逼真的非線性關系,是一種比較實用的預測方法。

圖5 質差話務比例模型準確性
(2)通過神經網絡算法建立上下行質差話務比例預測模型,為質差優化提供有效可行的數理統計模型。
(3)適用于各類運維類性能指標受多重因素交叉影響的指標建模與工作管控,如干擾預測、GSM下載速率等。
本文中應用的數學建模算法是BP神經網絡,適合解決復雜的非線性問題,有成熟的理論基礎,適用于各類運維類性能指標受多重因素交叉影響的指標建模與工作。與此同時,由于因素之間存在交叉影響,運算量極大,因此需要IBM SPSS Modeler軟件工具進行支撐,使建模工作得以大大簡化。
BP網絡自身還存在著一些缺陷,特別是隱層數和隱節點數的選取尚無理論依據,通常是采用試湊法來確定。不同的隱層數和隱節點數會形成不同類型與功能的神經網絡模型,將影響神經網絡擬合和預測效果,本文所選取的隱含節點數12就是根據多次訓練與學習得出。
而BP神經網絡突出的優點是具有很強的非線性映射能力和多元化的網絡結構,與傳統的人為分析統計建模方法相比,其預測精度較高,且預測方法較科學。
[1] 施彥,韓力群,廉小親. 神經網絡設計方法與實例分析[M]. 北京: 北京郵電大學出版社, 2009.
[2] 韓力群. 人工神經網絡理論、設計及應用[M]. 2版. 北京: 化學工業出版社, 2007.
[3] 閻平凡,張長水. 人工神經網絡與模擬進化計算[M]. 2版. 北京: 清華大學出版社, 2005.
[4] 趙峰. 基于BP神經網絡的項目投資風險評價[J]. 建筑經濟, 2006(10): 62-64.
[5] 張巍. 基于BP人工神經網絡的道路安全評價研究[D]. 西安: 長安大學, 2006.★