陳向東 江西省專用通信局 南昌市 330038
程科 江西省通信管理局 南昌市 330038
關鍵字:RRC重建 三板斧 性能提升
UE 在發生無線鏈路問題后會嘗試通過 RRC 重建進行自恢復。該過程會影響到用戶的實際使用感知,特別是對Volte 等實時敏感型業務的影響較大。
VoLTE呼叫中RRC重建和數據業務觸發機制以及對RRC層影響完全相同,在LTE常規優化和投訴處理中因為影響較小而經常被忽略。但RTCP協議對底層鏈路失敗引起的re-cover機制支持不好,所以RRC重建過程很容易被用戶感知到;另外RRC重建更有可能造成VoLTE掉話和接入事變。所以VoLTE優化和商用保障過程中,需要仔細梳理現網存在RRC重建的原因,并有針對性的采取優化措施。
重建是UE在連接狀態下,空口異常時重新恢復空口的過程。重建成功的前提是收到重建請求的小區有UE的上下文。重建的意義在于快速恢復空口業務,提高業務的連續性。
當處于RRC連接狀態時,如果出現切換失敗、無線鏈路失敗、完整性保護失敗、RRC重配置失敗等情況,將會觸發RRC連接重建過程。該過程旨在重建RRC連接,包括SRB1操作的恢復,以及安全的重新激活。處于RRC_CONNECTED狀態的UE,安全已被激活,可發起該過程繼續RRC連接。僅當相關小區是具有UE上下文的小區時,連接重建才會成功。假使E-UTRAN認可重建,SRB1的操作會恢復,而其它RB將繼續保持掛起。如果AS安全沒有被激活,UE不會發起該過程,而直接轉到RRC_IDLE狀態。
總體信令流程圖如下:

通過不斷實踐改進,針對影響重建問題的常見因素、重建觸發原因、重建失敗原因,總結出LTE重建性能提升三板斧基本套路。
2.1.1 KPI趨勢分析
思路介紹:確認問題場景,量化問題描述,搞清楚時間、對象和目標值。
問題場景:
◎ 場景一:KPI趨勢惡化或者搬遷場景。此類場景需要找到指標變化前后網絡差異,并確認差異的原因。如果現網某一時間出現KPI指標的突然惡化,需要重點排查惡化時間點,排查是否存在操作記錄、故障告警、突發事件等;如果現網出現KPI指標緩慢惡化,需要分析是否存在話務模型變化、季節因素、外部事件等;如果搬遷后指標無法達到原網,需要確認KPI映射、參數映射(包括特性)、功率映射是否實施。
◎ 場景二:存量優化或者新建場景。此類場景主要定位當前網絡的影響因素。通過現網數據分解出導致失敗的限制因素,是否存在覆蓋或者干擾等空口受限問題,是否存在參數配置、規劃不合理等問題,是否存在容量資源受限等問題。
分析方法:
(1)對場景一,獲取惡化或者搬遷前后可對比時段(話務模型盡可能相近)的數據,對比分析,確認問題發生時間點(粒度盡可能小)、惡化持續時間;確認KPI指標及其包含Counter的變化趨勢、惡化幅度等;
(2)對場景二,獲取數據分析KPI指標的及其包含Counter的變化情況,判斷是否存在規律。
2.1.2 問題范圍確定
思路介紹:整網問題還是TOP小區問題的區分是為了明確后續規定動作的入口條件,減少不必要動作的執行。
Top小區問題和整網問題的定義:
◎“Top小區”問題:分別去除Top10%的”KPI Top差小區”和”失敗次數Top小區”后,如果整網KPI指標明顯改善,達到目標值或者優于惡化前的KPI指標,則定義為Top小區問題。對于場景一KPI指標惡化或者搬遷場景,按照KPI指標和失敗次數的前后差值排序,取相對TOP小區;對于場景二存量優化或者新建場景,按照KPI指標和失敗次數的絕對值排序,取絕對TOP小區。
◎“整網”問題:分別去除Top10%的,如果整網KPI指標沒有明顯改善,未達到目標值或者仍差于惡化前的KPI指標,則定義為整網問題。
分析方法:取KPI指標計算時所使用的話統數據,按照KPI指標和失敗次數排序,排除絕對或者相對Top10的問題小區后,觀察KPI指標是否有提升或優于目標值,以此來判斷問題是“Top小區問題”還是“整網問題”。
2.1.3 話統原因分解
思路介紹:根據話統失敗原因對問題初步分類,不同失敗原因后續采用動作及順序有差別;另外還會參考相關話統指標,優化后續規定動作順序。
分析方法:使用FMA的“KPI分析”功能,分別將重建觸發原因和重建失敗原因細分。
(1)重建觸發原因問題分類:根據話統分析重建原因,切換失敗重建,重配失敗重建,還是Other重建。非源小區重建次數和占比分析是小區內重建還是重建到其他小區;不同重建原因指向的問題方向不一樣,決定了后面基本因素排查和推理分析的不同動作順序,即優先分析什么,什么動作可以不用分析。
(2)重建失敗原因問題分類:根據話統分析重建失敗原因,包括:資源分配失敗,重建拒絕,空口無響應;
資源分配失敗重建容量排查;
站內重建拒絕主要為RRC REL收不到,站間重建拒絕排查X2、鄰區,以及是否廠商間重建;
空口無響應主要排查上下行空口信號質量。
分析內容:根據標口跟蹤、CHR、CellDT等數據源作進一步分析,找出問題的根因。
排查思路:通過LOG的分析推導出問題的根因。
2.2.1 關聯指標分析
思路介紹:判斷KPI指標惡化與其他關聯KPI變化是否存在耦合關系。
◎ 重建比和重建成功率指標的影響因素存在差異或者發生變化時,同時會表現在一些關聯的KPI指標上,如話務模型、空口質量、資源負荷等。KPI關聯分析能夠從正面或者側面證明網絡的變化和差異。通過不同網絡的關聯KPI對比,確定網絡的限制因素。通過對象指標和關聯指標的耦合性分析,快速的定位問題根因或者完成初步隔離。
◎ 關聯指標及話統counter:小區平均用戶數、掉話率、切換出成功率、切換入成功率、平均TA 、上行干擾(IN)平均值、單板CPU最大/平均占用率(主控板與基帶板均需要查看)、上行誤碼率、下行誤碼率、平均CQI等。
分析方法:分析關聯KPI變化趨勢,如TA平均值、上行干擾電平、小區用戶數等。分析KPI指標異常或者惡化是否與關聯KPI指標的變化時間上具有耦合性,進而確認關聯KPI指標變化的原因。
2.2.2 重建原因分析
思路介紹:通過FMA工具對UU標口跟蹤分析重建原因和PCI。
分析方法:打開UU信令->右鍵選擇“Diagnosis”->Scenario選擇“Reestablishment”

?

?

?
3.1.1重建觸發原因問題分類:
Other類失敗導致重建占比為最高(74.5%),其次是切換失敗(25%),重配置失敗占比極少(0.5%)。

從重建UE目標小區分析,存在74.5%的重建次數為重建到非源小區上。通常UE在移動的狀態下發生重建時,容易重建到非源小區。

3.1.2重建失敗原因問題分類:無上下文RRC重建拒絕占比最高(87.5%),切換失敗觸發RRC重建拒絕占比12%,其余占比0.5%。

切換過早或切換過晚或乒乓切換等情況,將大大提升UE觸發RRC重建的機會,從現網統計的指標來看,切換失敗導致的RRC重建比例較高。通過鄰區漏配核查、冗余鄰區核查等方式,減少切換過早過晚及乒乓切換次數,從而改善RRC重建指標。
選取TOP 10個小區驗證,優化后切換成功率和RRC重建比例均有改善。

小區半徑優化:小區半徑設置過小,在存在超小區半徑切換入的場景下小區無法接入或接入至不合理小區后無線鏈路失敗導致重建。
非競爭隨機接入優化開關:該參數用于控制終端處于超過小區半徑的場景下的接入(非競爭)功能。如果開關為開,eNodeB針對超過小區半徑接入的終端進行優化處理,保證終端的接入;如果開關為關,非競爭隨機接入優化功能關閉。該開關對基帶板為LBBPc板時不生效。當eMTC功能生效時,非競爭隨機接入優化僅對LTE終端生效,對eMTC終端不生效。
現網通過對比小區半徑與小區用戶隨機接入TA均值發現,現網存在188個小區小區半徑設置過小。(以下是TOP小區舉例說明)

?
優化后TOP小區RRC重建比例改善0.60%。

弱覆蓋,重疊、越區覆蓋嚴重,會導致覆蓋區域接入、切換、重選等均出現問題;重疊覆蓋還會導致較為嚴重的模三干擾,對區域內的用戶感知等產生嚴重的影響。
通過MR可以看出,RRC重建高的小區很多都存在重疊覆蓋和越區覆蓋,需要進行RF優化。
該參數表示重復RRC重建保護定時器。當同一個RRC接入用戶重復發起RRC重建請求時間間隔小于保護定時器門限,則不統計重復的RRC重建請求以及成功的性能指標。該參數設置為0時,表示該功能不生效。參數單位為秒。
該定時器設置越小,越不容易滿足保護門限,統計的RRC重建次數越多;該參數設置越大,越容易滿足保護門限,統計的RRC重建次數越少。
該參數用來指示eNodeB對于UE存在某個QCI承載時是否發送和接收數據進行監測,如果UE存在的所有承載一直都沒有接收和發送數據,并且持續時間超過該定時器時長,則釋放該UE的RRC連接。參數單位為秒。
因此,適當調小UE不活動定時器時長,可以增加RRC請求次數,并減少可能發生的RRC重建次數,對RRC重建比例指標來說,減小了分子,增大了分母,對RRC重建指標改善較大。
(1)PCI混淆場景重建開關:該開關表示eNodeB是否支持UE在PCI混淆場景下發生重建。如果打開,則eNodeB支持相同PCI鄰區場景重建,如果網絡中存在PCI混淆時的重建場景,則重建成功率提升;如果關閉,則不支持該場景重建,對網絡無影響。
(2)S1切換場景重建開關:該開關表示eNodeB是否支持UE在S1切換場景下發生重建。如果打開,則eNodeB支持S1切換場景重建,如果網絡中存在S1切換后發生重建場景,則重建成功率提升;如果關閉,則不支持該場景重建,對網絡無影響。
(3)標準無上下文重建開關:該開關表示eNodeB是否使用協議標準的無上下文重建。如果打開,則eNodeB使用協議標準的無上下文重建,如果網絡中存在和其他廠商間進行無上下文重建,則重建成功率提升;如果關閉,則使用普通的無上下文重建,對網絡無影響。
(4)安全模式建立時重建開關:該開關表示eNodeB是否支持安全模式建立時響應該UE重建請求。如果打開,則響應UE重建請求,如果網絡中存在該場景下重建,則重建成功率提升,eRAB建立成功率提升;如果關閉,則拒絕UE重建請求,對網絡無影響。
通過多輪的攻堅優化, RRC重建占比改善0.4%,RRC重建成功率改善12%,差距大大縮短,已達到預期目標。


RRC重建指標是保障用戶感知的重要指標,頻繁的RRC重建對用戶的體驗會產生較為嚴重的影響,對保障用戶感知,提升網絡質量有非常重要的意義。
引起RRC重建的原因有很多,從目前發現的情況看,主要是參數、覆蓋、切換問題等原因導致,優化過程中,要結合不同地市的不同問題,對癥下藥,進行有針對性的優化,發現問題的根源,并進行相應的推廣,把點擴大到面,發現一類問題解決一類問題。