(新疆大學機械工程學院 新疆 烏魯木齊 830046)
基站退服是基站系統最為嚴重的故障,引起基站退服的原因有天饋故障、傳輸故障、載頻故障等。基站退服將不能為信號覆蓋區域提供無線服務。傳統的故障監控模式通常采用事中監測和事后分析方式,此模式在預測故障方面不足。故而,通過數據挖掘算法可以達到故障事前預警,將網絡監控數據轉化為運維數據價值,進而使基站退服的故障預警有可行性。
針對以上問題提出了基于移動運維數據的基站退服故障預測方法。首先對運維數據進行清洗、特征篩選,然后進行網元分類、指標降維,對主成分分析聚類,最后建立回歸方程進行故障預測,并驗證了退服預警模型的準確性。
1.退服關聯告警概率統計
以某市移動兩個月性能指標數據為例,約45萬個性能數據,數據來源為基站、傳輸和動環三個方面,包含退服、報警及狀態類型,時間粒度為15分鐘。取退服故障發生前4小時內的數據,當出現報錯、狀態變化等信息之后到出現退服的30-60分鐘之內。
2.數據清洗
以該市45萬個性能數據為例,其中基站數量為5119個、基站設備性能指標維度455個[1]。對全量均值化指標數據計算相關矩陣,按照工作和休息時間段進行協方差[2]的均質化處理,協方差矩陣的第(i,j)項(第(i,j)項是一個協方差被定義為如下形式:
cov(X,Y)=E[(X-μi)(Y-μj)]
(1)
其中是以n個隨機變量組成的列向量,并且是的期望值,即=(μi=E(Xi))。協方差矩陣的第(i,j)項。
3.特征篩選
根據相關系數判別標準選擇相關系數大于0.6的性能指標,將全量455個基站設備性能指標集降至62個。進一步去除相關性不大的性能指標后,基站設備性能指標集降至21個。
4.數據分類
在研究指標間的相關性時利用kendall相關系數,可分析連續、屬性和混合等三種方法來分析指標間的相關性。
kendall相關系數可有下式計算:
(1)
其中表示,中擁有一致性的元素對數;表示,中不一致性的元素對數。為元素個。通過相關系數計算得到每個基站性能的相關指標,將每個基站的相關指標利用各個指標的頻率特征經初查個基站的設備性能相關指標。
5.基站性能指標聚類
對基站設備的21個性能指標集進行聚類分析,聚類分析利用均值漂移算法[3](mean shift)對基站性能指標進行聚類。算法如下:假設每個基站指標可觀測設備性能指標維度為d,指標個數為n,記第個性能指標為,=1.2.3…,則對于第個基站,其mean shift向量的基本形式為:
(2)
其中,指的是一個半徑為的高維球區域,其定義為:
Sh(x)={y|(y-x)T(y-x)≤h2}
(3)
根據基站的位置、業務量等因素,基站可分為重要A基站、重要B基站、普通A站、普通B站等。
根據網元分類結果以第1簇為例對基站進行分類以及降維[4]。具體方法如下,設某類基站共有n個基站,每個基站共有個可觀測的設備性能指標,本文通過樣本相關全區間對設備性能指標做降維工作,記為第個基站的觀測向量。
xi=(x1,x2,…xim)
(4)
得的相關矩陣,具體表示如下
(5)
由|R-λEm|=0得R的個特征值及對應的特征向量。當≥80%時,將標準化后的基站設備性能指標變量轉換為主要成分,得其中(k=1.2…)(i=1.2…n),其中,X1為第一主成分,X2為第二主成分,依次類推,Xq為第q個主要成分。對個主要成分進行加權求,從而得到最終指標組合。
線性回歸模型滿足自變量與因變量要有線性關系。可以計算相關系數從而可以對降維后的基站性能指標中主要成分和基站退服次數關聯分析。經過關聯分析后,設最低相關系數的絕對值為0.11,大于最低相關系數的主要成分表達式,這表明主要成分與基站退服次數有一定的關聯。
回歸方程[5]建立如下:記(表示第個基站的第個主要成分)記為第個基站是發生退服故障所做的記錄,則擬建立。
zi=β1yi1+β1yi1+…β1yi1+β0+εi
(14)
i=(1…n)的線性回歸模型。進而對x1=(xi1…xim)T進行閾值的分析,達到對基站發生故障退服的預測。
以基站退服故障數據為基礎,將故障與告警數據關聯起來,對數據進行清洗、特征篩選,指標選取聚類并降維,最終得到客觀且有價值的數據。經過降維后的數據降低了故障數據之間的相關性,這就為基站故障預測提供更加有價值的數據。依托線性回歸方程建立的預測模型簡潔明了且計算高效。該預測模型充分發揮了具有時間屬性的有效數據,為維修人員通訊設備的檢查優先順序提供了價值參考,為今后故障排查作出科學客觀的指導。