文/王燕飛(中國移動通信集團北京有限公司)
VoLTE即長期演進語言承載,是一個高速無線通信標準,基于IMS網絡,在LTE上利用控制層和服務層形成特制的配置文件,這使得語音服務作為數據流在LTE數據承載網絡上傳輸,無須電路交換網絡。
VoLTE語音全稱為Voice over Long-Term Evolution,其本質是運營商推出的4G高清語音視頻通訊業務。作為一種基于IMS的語音業務,VoLTE語音也是一種IP數據傳輸技術,無須2G、3G,所有業務都由4G支持,實現了數據和語音業務共處在同一網絡。4G網絡本身能夠提供高速率的數據業務,而高質量的語音視頻通話則需要VoLTE技術實現。在網絡移動通訊快速發展的時代背景下,網速也大幅提升,將語音通話搭載在高速網絡上是語音業務發展的必然趨勢,而VoLTE語音也就是在4G高帶寬的基礎上,重新制作的語音視頻系統。從運營商角度來看,LTE本身的頻譜利用效率遠強于傳統制式,可達到GSM的4倍以上,可以有效提高無線頻譜的利用率,降低網絡成本。對用戶而言VoLTE不僅可以為其提供更高質量的語音服務,也有著更少的接入延遲以及接近于零的掉線率,極大地保障和提升了語音視頻質量。
人工智能技術的快速發展為VoLTE語音質量評測提供了技術支持,能夠幫助相關人員進一步了解用戶的語音體驗,幫助相關人員解決VoLTE語音出現的一些問題,從而提高VoLTE語音質量,更好地滿足用戶需求。利用智能語音分析技術可構建相應的VoLTE語音質量評測指標,以此實現對VoLTE語音質量的準確評價。
VoLTE語音系統構建需要根據聲學特征和人工神經網絡技術進行建模,將兩者收集和分析得到的大量數據融入整個系統。整個系統由采集層、處理層、數據層和應用層構成,通過科學合理的層次架構來保證用戶語音通話質量,提升用戶體驗,以此評估用戶反饋的內容。采集層由數據倉庫話單數據、用戶定位和GM口用戶數據組成;處理層則是將無線測量、RTP、通話信令進行處理得到相應的語音質量;數據層將得到的語音質量文件經過XDR輸送至應用層;應用層以此為基準,分析終端、質量、用戶等問題。
依托于人工智能的VoLTE語音系統是從海量測試樣本中提取特征信息,再運用大數據技術分析算法,客觀評價MOS質量,并模擬出不同的聲學特征與MOS數值的關系,建立相關的聲學特性信息模型,然后將后臺收集的用戶信息導入進行,解析用戶媒體載荷情況,實現評估的準確性,而MOS算法則依托于人工智能網絡的深度學習,逐漸從海量信息中接近實際情況。
模型在構建完成后使用單邊數據便能夠對全網通話進行精準評估,其中感知評測指標分為MOS、單通、斷續、RTP丟包等,只針對語音通話質量,無須識別語音內容,既保證了客戶信息安全,又能夠高效開展工作。可以通過SBC與P-GW之間的SGi口采集用戶信息,利用VoIP協議傳輸語音數據,并將所有語音載荷封裝在RTP當中,再將過濾出的RTP信息發送至解析系統即可[1]。
VoLTE語音關鍵評測技術是人工智能評定語音質量的核心,其包括利用MOS,根據人耳聽覺特性提取的聲學特征,評估出語言MOS分;利用VAD檢測技術獲取單通判斷關鍵內容;基于大數據訓練下人工神經網絡構建的斷續判斷技術;以及支撐新型網絡評測體系,同時結合多種外在因素,使評價結果體現用戶真實感知的分段評估技術。VoLTE語音關鍵評測技術的相互結合使用基本能夠覆蓋到語音視頻業務的全部區域,根據實際情況、用戶級別實現語音感知質量的綜合評估。
語音視頻質量檢測可以通過VAD檢測技術對聲波進行量化,并基于關鍵字匹配來讓人工智能學習語音特征,從斷續的語言段中分析得到相應的有效算法,以達到較高的準確率和判斷規則。
首先是VAD檢測技術,通過周期性檢測獲取RTP采樣得到的解碼片段,之后將采樣的語音信號分段計算每幀所含有的能量值,借此計算出整個片段的平均能量值。根據此平均能量值為采樣點狀態賦值。在信息安全方面應當利用關鍵字匹配技術來使人工智能進行準確檢索和匹配,結合HMM-Filler+融合置信度的判別方式,可以快速檢索匹配,并且無須識別語義,保證用戶通話內容安全。
其次,在單通判斷規則中,若語音視頻其中一端沒有聲音,上行無聲段丟包率低于閾值,且另一端同時沒有識別到語音活動或關鍵字語譜,便可以判斷為單通。而在無聲段中丟包率大于閾值,且有聲段滿足至少一個關鍵字語譜,則判斷為高丟包單通,可重新設置閾值。若無聲段丟包率低于閾值,且有聲段滿足至少一個關鍵字語譜,則證明是全程無能量的單通。
最后是斷續判斷規則,斷續判斷較為容易,根據關鍵字匹配技術和人工智能深度學習語音特征的方式,配置大量斷續檢測樣本,使人工智能具備一定的斷續判斷邏輯,便能進行具有較高準確率的斷續判斷。
VoLTE語音質量評測優化的基礎是用戶的各類信息。先從用戶位置信息進行探討。在使用計費單元和GX接口原始碼流等方式進行語音業務的用戶位置可以較為容易獲取開啟基站的用戶位置信息,并且網內X2、S1切換位置更新均能捕捉,其關聯正確率可達95%以上。而在使用RX接口的用戶,可獲取號碼及IP四元組,將GX接口包含的用戶位置信息及IP四元組聯系起來,獲得更為完整的用戶話單及位置信息。而在網絡覆蓋下人工智能對用戶感知評估及各類通話故障判斷的優化,可結合MR位置信息及小區無線信標,利用GIS等方法,快速分析出因無線質量問題引發的用戶感知問題,借此規避其他影響因素對質量評測的干擾,達到語音質量評測優化[2]。
現階段,人工智能技術已經廣泛應用于移動通訊網絡之中,而基于4G的VoLTE語音也可以結合人工智能,對語音視頻業務的通話質量進行評測及優化。通過對人工智能在VoLTE語音評測中的系統、技術、算法分析,可以明確人工智能技術對提高語音感知質量評測有著重要作用,能夠深度覆蓋VoLTE語音問題,進一步提升VoLTE語音業務質量。