張軍霞 韓紅蕊
摘 要:本文通過某運營商移動綜合網管日常維護的幾個小案例分析,對移動綜合網管數據缺失的幾個業務場景進行了闡述。在未來新的多樣化業務需求下移動綜合網管也需要基于發展愿景和當前網絡特點,選擇合適的組網方式。在各種網絡架構下數據保障依然是重中之重,本文通過這幾個小案例分享希望給相關人員提供一些有效的維護經驗。
關鍵詞:運營商;移動綜合網管;案例分析
隨著移動網絡的不斷壯大,移動綜合網管起著越來越重要的作用。如何更好地保障移動綜合網管采集的各類數據,盡可能地挖掘數據的有效價值成為從業人員越來越重視的問題,本文從維護的角度匯總了幾個小案例,希望給相關人員提供一些行之有效的維護經驗。
1 案例一、6月6日承德IUCS語音業務話務量異常增高的分析與說明
2019年6月7日,在每日的例行流量監控中,發現承德6月6日IuCS接口語音業務話務量異常增高7倍。
隨即開始查找原因。
首先查找綜合網管數據,綜合網管平臺是由采集和入庫兩部分組成,經過檢查,采集與入庫程序均正常,數據是從專業網管如實采集上來的。
其次檢查綜合網管與專業網管的接口正常連通,數據可以正常上報。
再次檢查在接口正常的前提下,數據是否從端局正常產生并從專業網管正常上報到綜合網管。從專業網管提取承德6月6日全天IUCS數據,發現承德端局網元無話務統計數據。由于話務統計是從端局生成后上傳專業網管進而上傳綜合網管的,端局如果話統生成有問題會引起上層綜合網管數據呈現,由此斷定問題出現在端局自身上。經過查找,發現當晚組POOL的端局未訂制IUCS文件的全局話統對象文件。
針對這種情況我們采取了以下措施:
(1)在承德端局訂制含有IUCS文件的全局話統對象文件,將組POOL后的端局話統數據寫入NAT為0的大本地網網元文件。
(2)綜合網管修改承德提取文件,由原來提取NAT為CDGS1.MGW1和CDGS1.MGW2的文件改為提取NAT為0的大本地網文件。
(3)通知廠家和相關人員以后網元組POOL后一定及時登記話務統計到大本地網并及時通知上層綜合網管。
7日上午9:49分,大本地網數據加入IUCS對象定制,問題解決。
本案例中有3個疑點,產生及原因如下:
疑點一:承德組POOL后話統數據未及時訂制導致大本地網數據缺失,現象應該是數據缺失,而不應該是爆漲。
原因:割接當時雖然數據未寫入大本地網,但上層綜合網管提取的原CDGS1.MGW1和CDGS1.MGW2數據在割接當時(6日凌晨1點)瞬間爆漲了近7倍,數據由正常的7萬多爆漲到47萬多,由于端局未對數據進行訂制,綜合網這照常去取原CDGS1.MGW1和CDGS1.MGW2數據導致數據呈現上出現了爆漲情況。
疑點二:為什么只影響IUCS話務量而沒有影響同在一個大本地網文件中的A接口話務量?
原因:IUCS接口的對象需要手動加入NAT為0的大本地網文件中而A接口的對象是可以自動同步到網管從而實現自動統計的,所以IUCS話務量受到了影響而A接口未受影響。
疑點三:為什么割接當時原話務統計數據會爆漲?
原因:組POOL過程中網元重啟,重啟網元引起數據異常。說明某廠家端局網元重啟會引起話務統計數據異常。
2 案例二、唐山某2RNC沒有性能數據處理與分析
2019年5月25日,在例行流量監控中發現唐山某兩RNC從5月20日開始一直沒有性能數據,隨即開始查找原因。
性能數據的呈現分3部分完成:(1)首先要通過CORBA接口從廠家FTP到性能文件。(2)采集服務器開始解析分析廠家的性能文件,通過解析插入到數據庫的底層數據性能表里面。(3)等采集完成后進程最后會觸發匯總,把底層的數據先匯總到中層,再從中層匯總到上層,最后呈現在報表上。
問題發現之后采取倒序檢查法,首先排除采集跟匯總這兩個過程,因為采集跟匯總都是按照OMC粒度進行的,不會對單個網元進程采集匯總。排除這兩種可能后直接查看第二步和第一步,查看采集服務器發現缺失性能文件,并沒有采集到廠家性能文件。
繼續檢查發現廠家服務器上發現沒有生成性能文件,后經過排查是由于設備掉電導致性能文件沒有生成。重新加電后性能文件生成正常,故障恢復。
3 案例三、石家莊邢臺某網管SERVER性能缺失數據處理與分析
5月23日12點發現石家莊邢臺某網管SERVER性能數據缺失,隨即開始查找原因。
經查,原因為廠家服務器未發送文件生成完成可以獲取性能文件的CORBA接口消息導致性能文件未采集成功。
此類問題無法直接定位原因,只能按照采集的過程一步步排查,最后找到問題癥結:(1)首先查看匯總發現底層跟上層都沒有數據,需要查看采集。(2)查看采集發現任務一開始就沒有獲取到要解析的性能文件,那現在就能知道是性能文件的問題了。(3)登陸CORBA服務器找到廠家性能文件存放的位置,結果沒有性能文件。
查看某廠家服務器有性能文件,這就說明是CORBA接口采集過程中出了問題。需要手工登陸到廠家服務器ftp過來性能文件,再采集、匯總問題解決。經過詢問該廠家服務器頭天晚上進行了設備升級但未重啟針對網管接口的FTP服務。
4 結論
某廠家網管服務器升級之后需要對綜合網管接口的FTP服務進行重新定制,否則廠家服務器將會出現不發送文件生成完成可以獲取性能文件的CORBA接口消息導致性能文件采集不成功。
作者簡介:張軍霞,女,高級工程師,就職于中國聯通河北省分公司網管中心,從事移動通信運行維護工作二十多年,主要負責移動核心網數據保障、異常指標核查、移動網運行分析等工作;韓紅蕊,女,高級工程師,就職于中國聯通河北省分公司網管中心,從事移動通信運行維護工作二十年,主要負責核心網的網絡資源及調度管理等工作。