邱 健
【摘要】文章比較系統地研究了移動通信網中的單通串音問題及其成因,對排查方法進行了探討,提出了建立長效預防機制的若干建議。文章的主要價值在于提出了處理客戶投訴時的3W3H原則和四單原則,以及排查和預防的系統表,對移動通信運營商整治單通串話有借鑒意義。
【關鍵詞】單通串話 3W3H 四單原則 排查預防
隨著移動通信網絡規模的不斷提升,網絡復雜程度不斷提高,網絡話音質量投訴明顯增多,客戶滿意度嚴重受影響。但因其成因復雜,分析手段有限,故障的快速排查和有效預防一直困擾著移動運營商。因此,有必要對單通、串話故障的成因進行分析,并結合具體設備,尋求快速排查和有效預防的方法。
1 單通故障表象及成因分析
1.1 單通故障表象
單通故障的典型表象為:通話雙方中僅一方能聽到對方講話,而另一方聽不到任何聲音。在更廣泛的意義上,通話過程中的雜音、回音、雙不通都可歸入單通的范疇。根據持續時長,單通可分為持續單通和間歇單通。例如:傳輸電路的鴛鴦線、環回線等將導致持續單通;無線環境差、FER高,則多表現為間歇單通。
1.2 單通故障成因
單通故障的成因,除了常見的工程性問題(鴛鴦線、接頭故障)、無線環境問題(FER高、通話質量差)外,還與相關設備的性能和數據配置有關。下面按照話音呼叫的常規路徑,逐段分析可能導致單通的原因。
(1)移動臺部分
因手機終端故障,引起各種通話質量差的現象,從而影響用戶的通話感受。
(2)無線系統
無線系統主要由基站、無線鏈路(電磁波)組成。按照語音信號的處理過程,基站部分可以劃分為基帶信號處理、射頻信號處理、射頻信號發送/接收三部分。以下將分別從各環節闡述無線系統中單通現象的機理:
a)天饋線故障;
b)無線信號強度突變或受到嚴重干擾;
c)BTS部分:
◆無線小區的上、下行鏈路不平衡;
◆基站信道處理板故障;
◆基站收發信機故障;
◆站內射頻電纜連接故障。
d)Abis接口部分:
Abis接口是BTS和BSC之間的接口。BTS和BSC兩者的CIC數據不匹配,兩者之間的傳輸中繼設備存在故障,DDF連線錯誤(鴛鴦線、環回線),各連線端口接觸不良,傳輸電路高誤碼等,都可能導致通話質量差,具體表現為單通、雙不通、雜音、回音等。這主要與工程施工質量、傳輸網絡的可靠性和穩定性有關。
e)BSC部分:
BSC部分直接引發單通的可能性較小。負責呼叫處理的單板/中繼板發生故障或連線錯誤時,可能連帶引起各種通話質量不良的現象。
f)A接口部分:
A接口是BSC和MSC之間的接口,主要實現碼速變換及幀選擇/復制的功能,即TRAU(碼速變換器)/Vocoder(聲碼器)。TRAU板件故障引發單通的概率較大。此外,鴛鴦線、環回線、傳輸設備故障等傳輸電路原因同樣會引發單通。
(3)MSC部分
◆交換矩陣
當話務負荷過高時,交換機不能正常疏通話務,用戶反復撥打會造成話務擁塞,使交換矩陣處理紊亂,可能導致單通。
◆互聯互通環節
本端交換局到關口局(GW)這一段網絡連接正常,但經關口局(GW)出局后,由于傳輸部分或兩端CIC數據配錯以及其他運營商的網絡故障等原因,也會導致單通。
◆錄音通知機
錄音通知可以向主叫方簡短提示呼叫未接通的原因,引導用戶正確發起呼叫。當錄音通知資源出現擁塞或故障時,會引發單通。應對各種呼損設置合適的錄音通知,以避免用戶反復撥打而造成話務擁塞。
(4)傳輸部分
所謂“鴛鴦線”是指一個E1系統和另一個E1系統的收發端接反,如圖1所示。由于“鴛鴦線”可能發生在A口,也可能發生在E口,且單通和串話成對出現,因而在此專門討論。

“鴛鴦線”連接時,設備的各端口仍能收到載波信號,不會觸發告警,卻無法通過線路環回進行檢查。如果用戶A和B占用了“鴛鴦線”連接的一對PCM系統,由圖1可知,A能聽到B的聲音,但B卻聽不到A的聲音,造成單通。如果用戶C和D占用了“鴛鴦線”的另一對PCM系統,則造成串線。“鴛鴦線”影響成對的E1,即可能影響兩對通話用戶而造成串線。這主要與工程施工質量、電路開通時沒有逐根(關閉-查看告警-打開)核對有關。
另外,傳輸中電路環回狀態也會導致單通、回聲或無聲現象,因此,在對電路做環測試后必須盡快恢復。
2 串話故障表象及成因分析
狹義來講,串話是指在通話過程中,隨機有第三方用戶串入正在通話的雙方,導致原通話雙方無法正常通話。而從廣義來看,串話與單通只是同一問題不同用戶的不同感受而已。
通常可能產生串話的原因是:
(1)與MSC CIC的管理分配、電路板的工作狀態以及MSC和BSC之間CIC的連接有關。CIC為電路識別碼,指MSC到BSC間的話音電路,其取值范圍是0~4095,電路群中每一個時隙對應一個CIC號。
(2)MSC到BSC間的2Mbit/s鏈路連接不正確,如2Mbit/s鏈路交叉,或2個2Mbit/s鏈路間的收發交叉等。
(3)MSC在通話結束后沒有釋放CIC,隨后又分配給其他用戶使用,可能引起串話。
(4)手機問題。手機在切換失敗后,應該以切換前的形式(包括頻點、時隙、全速率/半速率、加密模式等等)回到原來的信道,網絡對此無法干預。而文獻[2]中薩基姆手機在切換失敗返回時“擅自”改變信道參數,被認為是手機存在問題。
(5)切換問題。切換是造成串話的必要條件,但非充分條件。
(6)載頻問題。載頻自動重啟也會造成串話。
3 單通串話故障的快速排查
因單通串話故障的隱蔽性(在網絡設備上不會產生直接的告警)和傳統排查的低效性(逐條電路的CIC測試耗時耗力),為提高對用戶單通投訴的響應速度,我們結合前述單通故障的特點,探討快速排查的方法。
所謂“快速排查”,是指運用科學的方法在較短時間內準確定位故障點;首先是定位故障范圍,是全局的(整個MSC/BSC范圍)還是局部的(單個BTS的范圍)。若是終端側的原因,建議采用更換投訴用戶SIM卡、終端的方式進行排查;對于個別單通投訴,可排除終端側的原因,直接進行網絡側的排查。在排查過程中,應綜合考慮無線側和交換側的影響因素,以利于問題的準確定位。
3.1 用戶端信息排查方法
(1)用戶投訴詢問要素
10086接到用戶單通、無聲或串話的投訴后,應盡量詢問到下列詳細信息:
◆時間:投訴往往在事后,但發生問題的準確時間對后來的故障分析(如話單、信令的查詢)等有至關重要的作用。
◆地理位置:需要把主被叫發生問題時所處的位置描述得盡量詳細準確。
◆功能:手機SIM卡功能的調查,是否有彩鈴、VPMN等智能網的功能。
◆移動性:需詢問通話中主被叫手機是否在移動過程中。
◆故障現象:除了基本的故障現象外,還需詢問故障發生是在通話建立時還是通話過程中,以及問題出現的頻率。
簡單歸納為以下幾句話(3W3H):
◆什么時間發生的?(when)
◆在哪里發生的?周圍有什么建筑?室內還是室外?(where)
主被叫號碼?(who)
◆故障發生時手機是否在移動?(How move)
◆故障是發生在通話建立時還是通話過程中?(How happen)
◆類似問題在此地發生是否頻繁?(How offen)
注:第3點要素(who)關系到用戶使用哪些功能,客服中心可通過BOSS系統查得。
(2)利用用戶呼叫信息排查
研究用戶行為發現,用戶在遭遇單通、雙不通、串線等情況時,會在極短時間內掛斷電話重撥,這樣就會在通話路徑相關的設備上留下“超短通話記錄”(通話時間在30s以下),并且該設備上基本不出現“長呼叫”的通話記錄。因此,過濾出超短通話記錄,對與此呼叫相關的設備信息進行統計(如:出現短通話最多的某個中繼號、某個基站、某個信道板等),就能基本圈定可疑設備。對這些可疑設備進行針對性的軟/硬件檢查,就能很快排查故障。此方法操作簡便,應用廣泛。
3.2 交換側相關的排查方法
交換側排查方法總結如表1:
3.3 排查處理流程
流程描述如下:
(1)10086接到用戶單通、無聲或串話的投訴后,詢問到用戶異常通話的詳細信息。
(2)在獲得上述信息后,立即通知維護人員,以便及時進行現場路測。
(3)匯總10086的投訴,并結合現場測試結果確定故障發生的范圍:
◆集中在某個特定的基站下?
◆集中在某個BSC下?
◆集中在某個MSC下?
◆集中在某特定局向(如CMCC-UNICOM、TELECOM-CMCC)?
以上簡稱“四單”原則,即是否單個基站、單個BSC、單個MSC或單個局向?
(4)如果發生在某一基站下,首先查看EVENT歷史記錄有無RCI告警,嘗試更換相關硬件。
(5)如果基站上無告警,則通過撥打測試來斷定問題所在:
◆集中在一塊或多塊特定載頻,則先收集數據,然后執行INS操作或更換載頻。
◆集中在某一小區的全部載頻上,則檢查天饋線(分布式、直放站)系統、覆蓋及干擾情況。
◆集中在某一條傳輸的RTF上,則檢查傳輸是否連接正確及有無接觸不良問題。
(6)如果單通發生在某一個BSC下的多個基站,則問題出現在BSC側。首先查看歷史記錄確定是否存在CIC相關的告警,再通過命令確定CIC的物理通路,更換相應板件。
(7)檢查數據庫CIC配置是否有錯,以排除可能的軟件故障。
(8)如果沒有CIC告警,則使用儀表逐一監聽A接口、Abis接口的所有CIC,以確定出問題的CIC,然后更換板件,并檢查BSC-MSC之間的電路鴛鴦線、接頭阻抗大等問題。
(9)如果問題發生在特定局向,則確定無聲問題發生在上下行哪個方向。如從MSC側來的下行鏈路無聲,則問題不在BSS側。如果上行無聲,則不會固定在特定的局向,需參考上面的步驟予以排查。
(10)如果是一個MSC下的多個BSC產生單通現象,可對所有BSC逐一采用步驟(6)~(9)進行排查。同時在MSC側開展調查。
(11)如果不同MSC下的BSC出現單通,除了對相關BSC和MSC進行調查外,還應檢查MSC之間電路的配置和連接是否正常。

4 單通串話故障的預防措施
要對移動通信網的單通串話故障進行預防,可從兩個角度來分析:
4.1 系統外部變化
(1)工程

◆新增批量電路
在鋪設中繼線時,一定要貼好標簽,包括線序和收發端,盡量降低鴛鴦線、自環線的出現概率。在話務量小的情況下,可閉塞部分原有中繼,增加新增中繼的占用概率。調測電路一定要仔細,觀察時隙占用情況和對應的電路號,確保每條新增中繼都被測試到。
◆局數據調整
(2)網絡變化
◆啟機
◆新增部分電路
對于新開局、新增電路,要嚴格統一電路標識,并進行電路商用前的測試(電路維護測試、電路承載測試等)。
◆數據變化
◆互聯互通調整
對于互聯互通GW MSC,要定期進行傳輸電路的維護和測試。

4.2 系統內部變化
(1)指向性普查
◆局數據
◆硬件模塊
對重要區域的MSC,要定期進行交換矩陣的診斷和倒換測試。
◆接口檢查
(2)綜合性普查
◆話務統計分析
◆信令流程分析
◆話單分析
在密集城區、重要客戶聚集區的服務MSC、服務BSC,要定期檢查超短通話記錄,對可疑設備作進一步診斷。

單通串話故障因其成因復雜,排查和預防的手段需要在日常運維實踐中不斷豐富和改善。而無論是快速排查還是有效預防,目標都是提高投訴響應速度,改善用戶通話感受。
參考文獻
[1]劉嶸. 移動通信網單通故障的成因分析及排查預防[J]. 廣東通信技術,2006,26(7).
[2]彭四斌. GSM直放站覆蓋區串話問題分析[J]. 信息通信,2007(4). ★
【作者簡介】
邱健:碩士就讀于上海交通大學計算機技術專業,現任職于中國移動上海公司。