李含華,張國光,黎 越(中國聯通江蘇省分公司,江蘇南京 210019)
5G 網絡是一個新的技術領域,不同于2G/3G/4G的建設優化,沒有任何經驗積累和借鑒,協議標準還未制定完畢,目前處在邊建設、邊使用、邊摸索階段,一切都是探索。響應國家號召及要求,中國聯通和中國電信本著友好互利的宗旨,積極推動5G網絡共建共享進程,隨著站點越來越多,共享率穩健提升,雙方在覆蓋效果上都取得巨大成效;網絡快速建設的同時,帶來了網絡優化的滯后,與感知相關的NR 側切換成功率隨之惡化,其中站間切換成功率極為嚴重。切換失敗導致時延增加、信號變差、掉線等,造成速率降低,影響用戶感知。
本文針對NR 側站間切換問題進行研究,分析切換失敗的處理過程以及提升措施。
切換是無線網絡非常重要的事件,是保障網絡連續覆蓋的重要技術手段,要提升切換指標,首先要了解切換的流程,搞清楚切換信令打點位置,結合信令跟蹤,對失敗的信令點進行分析,找出失敗原因。
2.1.1 NR側站內切換打點
如圖1 中A 點所示,當gNodeB 向eNodeB 發送SgNB Modification Required 消息時,若是PSCell 的變更,則N.NsaDc.IntraSgNB.Change.Att累加。如圖1中B點所示,當gNodeB 收到eNodeB 發送的SgNB Modification Confirm 消息時,若是PSCell 的變更,則N.NsaDc.IntraSgNB.Change.Succ 累加。統計值累加在LTE-NR NSA DC 用戶所屬的PSCell 上。如圖1 中C 點所示,當eNodeB 收到gNodeB 發送的SgNB Modification Required 消息時,則L.NsaDc.SCG.Mod.Required.Att 累加。如圖1 中D 點所示,當eNodeB 向gNodeB 發送SgNB Modification Confirm 消息時,L.NsaDc.SCG.Mod.Required.Succ累加。

圖1 NSA場景下NR站內切換統計流程記錄
2.1.2 NR側站間切換打點
如圖2 中A 點所示,當gNodeB 向eNodeB 發送的SgNB Change Required 消息時,N.NsaDc.InterSgNB.Change.Att 累加。如圖2 中B 點所示,當gNodeB 收到eNodeB 發送的SgNB Change Confirm 消息時,N.NsaDc.InterSgNB.Change.Succ 累加。如圖2 中C 當eNodeB 收到gNodeB 發送的SgNB Change Required 消息時,L.NsaDc.SCG.Change.Att 累加。如圖2 中D 點所示,當eNodeB 向gNodeB 發送SgNB Change Confirm 消息時,L.NsaDc.SCG.Change.Succ累加。
2.1.3 NR側切換成功率計算方法
NR側切換成功率的計算方法如表1所示。

表1 NSA切換指標定義
通過對某地(市)大量的路測跟蹤分析發現,站間切換失敗問題(X2 接口觀察SGNB_CHANGE_REFUSE)的原因大多是:“transport-resource-unavailable”。
結合網管跟蹤分析發現:當gNodeB 收到eNodeB發送的SgNB Change Refuse 消息時,消息中CAUSE 大部分都是:“transport-resource-unavailable”;如圖3 右所示:錨點LTE 基站直接判斷與目的NR 站點之間X2傳輸資源不可用,返回SGNB_CHANGE_REFUSE 并攜帶原因“Transport Resource Unavailable”;如圖3 左所示:錨點LTE 基站發起了輔站添加,但是目的gNodeB反饋了SGNB_ADD_REJ,攜帶原因“Transport Resource Unavailable”,LTE 回 復 源 gNodeB SGNB_CHANGE_REFUSE 并攜帶原因“Transport Resource Unavailable”。所有的原因值都指向了“Transport Resource Unavailable”。

圖2 NSA場景下NR站間切換統計流程記錄

圖3 站間切換流程
結合以上NR 站間切換失敗流程分析,造成切換失敗的主要原因有鄰區漏配、PCI 混淆、干擾、越區覆蓋等等,結合測試及信令跟蹤發現,打點均是“transport-resource-unavailable”傳輸資源不可用,因此本文則將著重分析產生該問題的原因,主要原因如下:X2未配置、傳輸故障、其他問題,具體處理流程如圖4 所示。
結合圖3 站間切換流程打點位置可知,站間切換成功率低的直接原因是服務基站下發的SgNB Change Required 很多,但是服務基站收到的SGNB Change Confirm很少。
因為UE 與MeNB 與S-SgNB 是雙鏈接,且能正常做業務,因此UE與MeNB的連接以及MeNB與S-SgNB的連接是沒有問題的,并且MeNB 和S-SgNB 的狀態是正常的。站間切換成功率低的最大原因是MeNB 與T-SgNB間的某一環出現問題,問題大致分成3類。
a)MeNB 網元側問題:MeNB 收到了SgNB Change Required 的消息,但是沒有向T-SgNB 發送SgNB Addition Request,存在如下2種原因。
(a)MeNB 不知道T-SgNB 是誰,也就是沒有配置4G/5G 的鄰區關系,可以通過LST NREXTERNALCELL 以及LST NRNRELATIONSHIP 來查詢4G/5G 的外部鄰區以及4G/5G的鄰區關系。
(b)MeNB 存在與T-SgNB 小區同PCI 的4G/5G 鄰區,即PCI沖突,MeNB 無法明確向哪個小區發送SgNB Addition Request,所以不發送該信令。
b)MeNB 與T-SgNB 的X2 鏈路問題:MeNB 向TSgNB發送了SgNB Addition Request,但是T-SgNB沒有收到SgNB Addition Request,存在如下3種原因。

圖4 傳輸原因導致站間切換失敗問題分類
(a)該4G/5G 的X2 鏈路不存在。MeNB 側和TSgNB 側的X2 自建立開關沒有打開,不能自建立X2 鏈路;MeNB 側的X2 鏈路滿規格,不能繼續建立更多的X2 鏈路,導致該4G/5G X2 不能自建立;MeNB 側和TSgNB 側的X2 自建立開關均打開,但沒有X2 自建立,主要是跨網管X2自建立出現問題。
(b)該4G/5G 的X2鏈路故障。通過查詢MeNB 側和T-SgNB 側的X2 鏈路來判斷4G/5G 和5G-4G 的X2鏈路是否正常;5G-4G X2 鏈路檢查的MML 指令為DSP GNBCUX2INTERFACE,4G/5G X2 鏈路檢查的MML 指令為DSP X2INTERFACE,目前X2 鏈路異常的主要原因是底層鏈路故障,需聯系無線和傳輸核查人員基站IP配置、路由等故障。
(c)該4G/5G的X2鏈路告警。
c)T-SgNB網元側問題:主要是網元斷鏈問題。
NR 側站間切換問題識別可以通過指標項NSA 架構下NR 特定兩小區切換出嘗試次數、NSA 架構下NR特定兩小區切換出成功次數來計算出點對點切換失敗次數,從而得出切換失敗較為嚴重的鄰區對信息。
針對全網站間切換失敗問題,排除配置類問題和快速定位傳輸問題站點是快速解決網絡級問題的主要思路,具體為:
a)篩選問題TOP 小區,排查4G 錨點站與5G 站點間的X2 鏈路和鄰區是否配置完全(重點排查聯通4G錨點與電信5G共享站的X2鏈路和鄰區關系)。
b)避免異頻組網,電、聯共享站建議采用同頻組網,當前終端不支持異頻切換。
c)連片區域盡量避免共享和非共享站點插花情況出現。
d)主控板X2 規格滿問題,造成X2 底層鏈路故障,通過告警ALM-29225 X2 接口規格滿告警識別,更換高規格單板提升X2規格。
e)避免站間切換時,目標站點存在小區不可用故障,或網元斷鏈等故障。
為改善NR 站間切換成功率指標,啟動專項優化,并系統性分析站間切換失敗原因,包括失敗站點地理化分布、4G/5G 錨點X2 接口、鄰區關系核查以及共建共享策略核查等內容。具體手段為:
a)TOP 問題分析:TOP20 失敗次數之和占全網切換失敗次數總數的41.23%,解決后全網PScell 站間切換成功率可提升9.33%;前TOP 100 失敗次數之和占全網切換失敗次數總數的74.80%,解決后全網PScell站間切換成功率可提升30.59%;綜上,為提升全網PScell 站間切換成功率,優先處理TOP20 小區,后續持續處理TOP100小區問題。
b)關鍵優化動作:共建共享配置基線核查(每月核查一次全網NR 基線參數);X2/鄰區核查(L-NR,NR-NR)(每周核查,并解決一次);TOP100 小區切換目標小區狀態核查(每周核查一次);NR異頻頻點插花組網核查(每周核查一次)。
4.2.1 X2故障導致切換失敗
問題分析:某基站向目標基站切換失敗45 691次,切換成功100次。查看網管告警,發現錨點站點與目標NR 站點之間存在X2 告警,原因是底層鏈路故障。因為目的站點和LTE站點之間的X2不通,會導致切換失敗,這樣反復的嘗試,短期內導致大量的切換失敗現象。
問題解決:通過兩兩小區話統分析出切換失敗次數最多的目的站點信息,通過U2020 導出NR 側X2 報表信息,根據報表顯示的X2 故障進行排查,經過協調無線側將X2底層鏈路故障全部恢復后,站間切換指標也恢復正常。
4.2.2 傳輸中斷導致切換失敗
問題分析:某基站向目標基站扇區1(切換失敗15 567 次)和扇區2(切換失敗36 816 次)切換失敗總次數52 383次。
檢查CHR 日志,發現失敗切換目標主要是gNodeB ID 為5243109 的站點,切換失敗的原因為X2 消息回復傳輸資源不可用。
登錄網管查詢,gNodeB ID 為5243109 的站點當前狀態為傳輸已中斷,長期觀察gNodeB ID 為5243109,當傳輸中斷故障恢復后,站間切換指標恢復。
因此,確認此站點切換失敗主要原因為切換目標5G 站點傳輸中斷但小區仍然正常發射。由于切換實際未觸發成功,而終端能夠一直搜索到目標小區,持續上報A3 事件,會導致切換請求持續觸發,所以一個用戶在一次業務過程中可能會產生大量切換失敗。
當前版本下,NSA 組網,沒有S1-C,只有S1-U,基站傳輸中斷,不會觸發小區去激活,小區不退服仍然發射。當前傳輸中斷場景遵循此種機制的主要原因如下。
a)X2 故障,自建立方式下,本站多個X2 故障時,如果小區去激活(AAU 不發功),后面該站與其他eNB的X2路徑無法發起自建立,也無法進行接入和切換業務。
b)S1 故障,自建立方式下,本端基站無法感知對端地址全集。假設對端10 個地址,先建立7 個都不通,此時去激活小區,那后面3個可能嘗試的地址也沒有機會與此小區通信進行業務處理。
問題解決方法:針對站點傳輸中斷,小區仍持續發射導致切換失敗的站點,可通過命令MOD GNBRSVD:RsvdParam23=50;打開基于資源準備失敗的切換懲罰機制進行優化,徹底解決問題。該參數用于控制資源類切換準備失敗懲罰定時器時長。當向目標小區切換時,若資源類切換準備失敗,則在該定時器內禁止切換到該目標小區。該參數有效取值范圍為0~50,當取值為0 時,表示不進行懲罰;當參數配置為1~50 時,實際生效值為界面配置值;當參數取值范圍超過0~50 時,按照0 生效,該優化的網絡影響如下:參數配置越小,資源類切換準備失敗后發起無效的切換請求次數越多;該參數配置越大,發起無效的切換請求次數越少,但UE可能會因為切換不及時,導致掉話。
如下5 種資源類準入失敗原因,UE 不再切換到目標小區(通過設置懲罰定時器對目標小區進行懲罰,懲罰定時器內UE 不再向該懲罰小區發起切換重試):No radio resources available in target cell;Transport resource unavailable;Not enough User Plane Processing Resources;Radio resource not available;Control Processing Overload。
4.2.3 底層傳輸故障導致切換失敗
問題分析:某基站向目標基站切換失敗11 922次。核查發現配置數據正常,切換失敗原因為目標站點傳輸故障,經核查發現,目標站點X2 全部底層鏈路故障,懷疑站點傳輸配置可能存在變更。
問題解決結果:經過協調無線側將X2底層鏈路故障全部恢復后,站間切換指標也恢復正常。
通過對TOP 站點的分析和處理,站間切換問題持續提升,較2020年2月初的站點切換成功率的20%,提升至2020 年4 月初的70%以上(2020 年4 月3 日為75.86%),提升超50%。優化后失敗次數為1 000~3 000次的小區明顯減少。
NR 站間切換成功率優化提升是一個循序漸進的過程,沒有相關的經驗借鑒,經過一段時間的優化,站間切換成功率有了較大的提升,但與4G 相比,差距還很大,需要不斷研究跟進,反復調整驗證,積累經驗,爭取盡快達到與4G 網絡同等水平。后續仍需推動如下工作:推動電信全量站點共享,避免因未共享站點,且同頻的情況下,影響中國聯通側NR 站間切換失??;對鄰區、X2 缺失問題進行核查,4G 錨點添加必要5G鄰區,增加缺失的X2,刪除冗余的X2;核查中國聯通4G 和5G、中國聯通5G 和5G 鄰區PCI 混淆問題,以及外部鄰區信息配置不一致問題,逐步修改;跟蹤數據調整后的指標,持續推進處理TOP 小區;把SCG 站間變更、4G/5G 鄰區核查、X2 核查加入日常網優工作,完善指標維護與基礎配置數據的準確性管理。