廖偉全,葉連響,江 圣
(中國移動通信集團廣東有限公司韶關分公司,廣東 韶關 512029)
隨著各電信運營商積極推廣交互式網絡電視(Internet Protocol Television,IPTV)業務,現IPTV業務基本已惠及普通家庭。因各電信運營商對IPTV業務的競爭和用戶對業務質量要求的提高,IPTV業務質量保障變得越來越重要。IPTV集合了直播、點播和時移電視等視頻功能,具有大帶寬、實時性強的特點,對IP網絡要求很高。過去“盡力而為”的IP網絡被認為能夠容忍的一些問題,給IPTV業務帶來了很多問題,如承載IPTV數據包發生抖動、時延、丟包都將使IPTV終端出現馬賽克、卡頓、黑屏等現象。為提高IPTV的業務質量,出現了IPTV的Qos保障優化措施,如根據視頻包內I、B、P幀對視頻解碼復原影響程度在網絡側進行分優先級的隊列丟包保護措施[1],也有采用對網絡各層級節點布放監測點進行全局優化和保障[2-4],但較復雜,難以全面部署。
IPTV是端到端的業務,涉及全程全網。考慮到現網保障中存在人力投入多、重復勞動多、發現故障慢及用戶感知不佳等問題,本文通過服務質量管理(Service Quality Management,SQM)系統采集電視機頂盒(Set Top Box,STB)的丟包、電視卡頓時長占比等指標,和STB歸屬的BNG、OLT、小區等信息,進行網絡分層聚類,然后對問題核查確認。
IPTV是端到端業務,采用點播、直播分離承載方式構建網絡解決方案。其中,點播業務采用“單播+CDN”模式構建,直播業務采用組播技術構建,單播、直播業務從業務流程上完全分離。以廣東某運營商為例(如圖1所示),IPTV平臺主要包括省中心節點(一級CDN)、區域中心(二級CDN)和邊緣節點(三級CDN)架構,部分業務量小縣區采用二層CDN架構,網絡層面主要包括省網、IP城域網和GPON承載[5]。內容源經專線下發給IPTV省中心節點。

圖1 某運營商城域網與GPON拓樸
點播業務主要采用單播路由,業務流為STB經ONU上聯到OLT,然后OLT雙上聯到城域網BNG,然后通過城域網訪問CDN。
主要流程如下。
(1)STB開機后,認證信息通過ONUOLTBNG上送到省級radius系統進行認證。認證通過后,DHCP服務器分配地址給STB,STB請求播放指定節目到EPG。
(2)EPG返回節目URL給STB,然后STB向二級/三級CDN點發起VOD點播請求。
(3)二級/三級CDN節點可以滿足時,與STB建立連接和發送碼流。若發現無法滿足STB的服務請求時,向CDN Manager請求下一個有能力提供服務的CDN節點B。
(4)CDN Manager返回給二級/三級CDN節點下一個提供服務的CDN節點B。
(5)二級/三級CDN節點向STB返回下一個提供服務的CDN節點B的URL地址。
(6)STB向CDN節點B發起VOD請求。CDN節點B判斷本地內容存在且配額滿足,然后給STB回響應。
(7)STB向CDN節點B發起消息,申請建立媒體鏈路。
(8)CDN節點B給STB回響應。
(9)STB向CDN節點B發送播放請求。
(10)CDN節點B向STB發送碼流。
CDN上面存儲的視頻點播次數少于設置的閥值時,將進行內容老化。
直播業務主要采用PIM組播協議實現,PIM利用單播路由協議生成的單播路由表為IP組播提供路由,并通過逆向路徑轉發(Reverse Path Forwarding,RPF)機制實現對組播報文的轉發。通過在IP城域網部署PIM實現組播報文的轉發,GPON接入網絡則通過IGMP協議實現組播包的轉發。
組播流量轉發流程如下。
(1)內容源始終向平臺的源DR發送組播數據。
(2)源DR至RP流量轉發:DR通過pim register消息用單播報文發送組播流量到RP。
(3)RP到接收者DR的流量轉發:根據RPT樹逐跳下發流量。
(4)接收者DR到客戶端的流量轉發:
①流量到達BNG,BNG查詢本機的二層組播表項,將流量發送至對應組播VLAN,到達OLT。
②OLT將組播流量在組播VLAN中廣播,并支持跨VLAN組播復制功能,將組播流量復制到ONU上關聯組播VLAN的單播VLAN。
③ONU查詢本地二層組播表項,轉發給機頂盒STB。
④流量到達客戶端STB。
IPTV業務流經設備有終端、GPON接入網、IP城域/骨干網、內容分發網絡(Content Delivery Network,CDN)和內容源,所以業務質量排查涉及面較廣。因IPTV業務對網絡質量要求很高,任何一個環節出現問題都會影響用戶感知,只是位置不同、影響程度不同且需全專業進行排查,過程往往艱辛復雜[6]。
經分析,某市運營商的IPTV業務故障原因匯總如表1所示。

表1 IPTV業務質量原因表
IPTV業務中點播主要采用TCP傳輸協議,是面向連接有保障的。直播業務為實時業務,對時延敏感,采用UDP協議承載,數據包丟失后沒有重傳保障,所以直播業務對丟包敏感,對網絡質量要求高。
IPTV業務質量提升需要全專業協同,現運營商基本均有在STB部署軟探針和SQM系統。通過系統可以采集到STB的TS丟包、電視卡頓占比(卡頓和花屏時間與總播放時間的比值)等指標來評估STB的性能,且可以采集到STB歸屬的小區、OLT及BNG等相關信息。
聚類分析又稱群分析,是研究(樣品或指標)分類問題的一種統計分析方法,也是數據挖掘的一個重要算法。聚類分析普遍用于多種專業領域[7]。結合SQM系統,本文提出了基于分層聚類分析的IPTV質量優化方案,主要實施流程為:
(1)SQM系統采集某市運營商各STB的電視卡頓占比,因為每一個STB數據關聯不同的網絡層(小區、OLT、BNG),通過分網絡層級的聚類可取出質差BNG、質差的OLT和質差的STB;考慮到BNG及以上網絡層級出故障概率較少,所以主要以OLT為維度進行分析。邏輯流程如下。
①取某小區平均電視卡頓時長占比為X,閾值為全網平均電視卡頓時長占比平均值Y,X大于Y分類為質差小區,建立質差小區表。后續核實確定為質差小區時,將質差小區X的最小值設為閾值Y。同理,建立質差OLT類和質差STB類。
②取質差小區、STB中歸屬非質差OLT設為嚴重質差小區類和嚴重質差STB類,優先核實處理。
(2)使用一臺Windows Server 2012服務器搭建SQL2012數據庫,用visual studio 2015拱建WEB,然后調用python3執行程序,并將結果輸入數據庫。程序實現輸入IPTV帳號OLT,然后輸出城域網、GPON的檢查報告,以確認是否存在質差問題。邏輯流程如下。
①程序通過SQM導入的表格,核查業務歸屬的小區、OLT和BNG。
②程序分別登入OLT和BNG,在BNG提取上下聯端口的丟碼、鏈路利用率和收光情況。在OLT首先進行拉流測試,通過拉流確定OLT接收的組播視頻包是否存在丟包問題。若有,則上層存在問題;沒有,則下層存在問題。然后,通過指令核查OLT上聯端口收光、誤碼及鏈路利用率等信息,還有是否軟失效、內聯板是否有丟包等問題。
③通過上述核查確認是否有隱患存在網絡相應層級,BNG通知城域網專業處理,OLT通知GPON專業處理。若未發現城域網和GPON問題,則通知客戶側專業處理,如重啟、更換STB等。表2為某一次核查結果。

表2 IPTV業務質量核查結果
若核查未發現原因又存在客戶投訴,則按照OLT拉流結果進行問題定界,確定核查的專業。由于電視質差問題原因眾多,甚至存在未發現過的原因,所以成立虛擬支撐團隊(包含平臺、接入網、城域網和裝維專業)將有助于支撐解決IPTV質量問題。
為驗證基于分層聚類的IPTV業務質量方案提升的有效性。經過持續一月的實施,圖2展示了采用本文方案后電視卡頓和TS丟包率的明顯改善。可見,整個市運營商總電視卡頓占比減少了0.24%,TS丟包率減少到接近為0,效果明顯。

圖2 電視業務指標比較
本文從端到端角度分析影響IPTV業務質量的因素,提出了基于分層聚類分析的IPTV質量優化方法來提升用戶感知。某市運營商網絡實踐證明,本文方案可以迅速輸出各專業常見問題的核查結果,減少不必要的人力成本和重復勞動,提高運維效率;可以提前進行預判和發現隱患,于故障發生前解決問題,提高網絡健康度,同時提高用戶感知;通過程序在OLT進行拉流定界,可實現預判問題所處專業,可有效減少專業間的溝通協調時間。本方案應用效果良好,實現了IPTV業務質量的改善,有推廣應用價值。