郝慧琴,潘 煒,王龍山,蘇 達
(中國電信股份有限公司 山西分公司,山西 太原 030006)
隨著網(wǎng)絡(luò)傳輸技術(shù)的不斷發(fā)展,國家提速降費戰(zhàn)略的深入推進,客戶對網(wǎng)絡(luò)的需求日漸提高,對網(wǎng)絡(luò)質(zhì)量的要求也不斷提高。在線路產(chǎn)品同質(zhì)化、價格競爭白熾化的情況下,運營商不能一味通過降價陷入惡性循環(huán)。
面向企業(yè)的各類線路業(yè)務(wù),客戶已不再滿足于運營商提供的網(wǎng)絡(luò)是否連接或中斷,并要求公司提供的網(wǎng)絡(luò)服務(wù)超過某一項要求。在對用戶檢測和運營商監(jiān)管還沒有統(tǒng)一標(biāo)準(zhǔn)的大背景下,山西電信根據(jù)公司定位勇于創(chuàng)新,通過與客戶經(jīng)理研究、發(fā)現(xiàn)客戶真實需要、了解客戶的痛點,并結(jié)合對互聯(lián)網(wǎng)質(zhì)量控制的公司實際,設(shè)計了一套云網(wǎng)集成、獨立控制、輕量部署、高效迭代的整體解決方案,以差異化改善業(yè)務(wù)質(zhì)量、提升市場競爭力。
隨著我國光纖網(wǎng)絡(luò)的建設(shè)和普及,政企客戶對網(wǎng)絡(luò)質(zhì)量的要求也不斷提高,但是對網(wǎng)絡(luò)質(zhì)量的要求、監(jiān)測方式和監(jiān)測手段也不盡相同。
目前,常用的幾種網(wǎng)絡(luò)質(zhì)量檢測方法(見表1)如下文所述。

表1 網(wǎng)絡(luò)質(zhì)量監(jiān)測方法對比
(1)物理鏈路監(jiān)測。通過光功率計等設(shè)備對光纖鏈路的損耗進行測試,判斷網(wǎng)絡(luò)傳輸質(zhì)量。
(2)硬件設(shè)備監(jiān)測。一是硬件探針檢測,通過在網(wǎng)絡(luò)不同位置放置專用的硬件探針,實現(xiàn)網(wǎng)絡(luò)質(zhì)量的自動檢測;二是設(shè)備自發(fā)包檢測,基于RFC2544和Y.1564的自發(fā)包命令,通過發(fā)包設(shè)備對包的檢測和統(tǒng)計判斷節(jié)點之間的網(wǎng)絡(luò)質(zhì)量。
(3)基于網(wǎng)絡(luò)協(xié)議的監(jiān)測。一是ping命令,基于控制報文協(xié)議(Internet Control Message Protocol,ICMP)協(xié)議,發(fā)送ICMP包到目的設(shè)備,通過返回值來判斷網(wǎng)絡(luò)質(zhì)量。二是iperf3/Netperf命令,基于傳輸控制協(xié)議/網(wǎng)際協(xié)議(Transmission Control Protocol/Internet Protocol,TCP/IP)和用戶報協(xié)議/網(wǎng)際協(xié)議(User Dategarm Protocol/Internet Protocol,UDP/IP)協(xié)議,可以實現(xiàn)網(wǎng)絡(luò)帶寬使用率和網(wǎng)絡(luò)質(zhì)量的監(jiān)測。
由于物理鏈路監(jiān)測耗時耗力并且需要專人配合測試,僅適用于故障判斷與處理;硬件設(shè)備監(jiān)測對設(shè)備有一定要求,同時很多設(shè)備不在用戶側(cè),操作難度大、調(diào)整流程多;iperf3/Netperf命令獲取數(shù)據(jù)較全,也很方便,但是需要服務(wù)端、客戶端均安裝,無法輕量化部署。最終,項目選擇ping命令作為最有效、最通用、最輕量的監(jiān)測手段。
基于客戶對運營商網(wǎng)絡(luò)質(zhì)量要求不斷提高這一主題,提出政企客戶與運營商之間應(yīng)該采用同樣的標(biāo)準(zhǔn)和方法,因此自主研發(fā)了“網(wǎng)管專家”這一軟件,基于ping命令對網(wǎng)絡(luò)質(zhì)量進行監(jiān)測、統(tǒng)計、分析和可視化展示等功能。同時,推出網(wǎng)管專家全家桶系列軟件(見圖1),全方位功能覆蓋,滿足各層級政企客戶。

圖1 網(wǎng)管專家全家桶系列軟件
(1)PHP版本,對客戶開放源碼,供客戶進行學(xué)習(xí)、應(yīng)用、二次開發(fā)。
(2)PHP升級版本,結(jié)合用戶需求,對原有版本進行迭代,增加不同維度的數(shù)據(jù)標(biāo)記、報表統(tǒng)計、報表分析等功能。
(3)Java專享版,對金融行業(yè)等有維護能力、自主管理的需求、有指定軟件版本、較高要求的高端客戶,通過調(diào)研其實際需求,通過Java專享版網(wǎng)管專家項目的開發(fā)和迭代,實現(xiàn)專享定制開發(fā)、私有化部署。實現(xiàn)統(tǒng)一網(wǎng)絡(luò)資源管理、網(wǎng)絡(luò)設(shè)備管理、電路質(zhì)量監(jiān)控、故障通知、自主故障處理、服務(wù)過程全程可視化、權(quán)限管理、運營分析等功能。
網(wǎng)管專家系統(tǒng)架構(gòu)如圖2所示。

圖2 網(wǎng)管專家系統(tǒng)架構(gòu)
(1)底層架構(gòu)。采用Python+PHPJava+VueNginxMySQL等主流開發(fā)技術(shù),輕量化部署,僅1臺PC機即可實現(xiàn)全部功能。
(2)網(wǎng)絡(luò)質(zhì)量監(jiān)測功。系統(tǒng)實現(xiàn)統(tǒng)一監(jiān)控,全面、實時動態(tài)掌握用戶網(wǎng)絡(luò)實際情況,包括設(shè)備性能監(jiān)控、設(shè)備狀態(tài)監(jiān)控、網(wǎng)絡(luò)性能監(jiān)控、設(shè)備性能指示預(yù)警、網(wǎng)絡(luò)通斷監(jiān)控、實時告警通知。
(3)故障處理可視化功能。當(dāng)系統(tǒng)提醒客戶發(fā)現(xiàn)問題時,通過業(yè)務(wù)全生命流程的可視化讓故障處理進展一目了然。
(4)統(tǒng)一資源管理功能。統(tǒng)一網(wǎng)絡(luò)管理,全面、動態(tài)掌握網(wǎng)絡(luò)情況,資源和設(shè)備全生命周期性的管理,設(shè)備運行狀態(tài)實時查看。
(5)運營統(tǒng)計分析服務(wù)。基于監(jiān)測數(shù)據(jù)、專業(yè)化運營統(tǒng)計分析及網(wǎng)絡(luò)優(yōu)化建議,報表統(tǒng)計、生成和導(dǎo)出功能。
整個系統(tǒng)部署在1臺核心服務(wù)器,基于ICMP協(xié)議測試對端IP地址的網(wǎng)絡(luò)質(zhì)量,測試參數(shù)包括包的大小、數(shù)量、時間、次數(shù)等,測試結(jié)果包括丟包、時延、丟包率等;系統(tǒng)設(shè)置自定義告警規(guī)則,符合規(guī)則會自動啟動MTR,實現(xiàn)網(wǎng)絡(luò)質(zhì)量監(jiān)測的1個路由追蹤,對故障處理具有參考和指導(dǎo)意義。
整個系統(tǒng)考慮IP地址量大和ping測量大的時候,會出現(xiàn)ping測第1輪未結(jié)束,第2輪即開始的重疊監(jiān)測和記錄情況,采用多線程技術(shù)來保障測試的快速、穩(wěn)定,經(jīng)過測試,在Windows系統(tǒng)下使用默認ping測命令及參數(shù),對上千個IP可實現(xiàn)分鐘級測試。由于Linux和Windows系統(tǒng)之間存在差異,且網(wǎng)絡(luò)狀態(tài)、目的地址狀態(tài)等均有關(guān)系,表2所示測試結(jié)果為同一環(huán)境、同一主機、同一網(wǎng)絡(luò)情況下進行的多次情況平均值,作為對比參考使用。

表2 單線程與多線程測試對比表 單位:s
同時,對數(shù)據(jù)結(jié)果的保存,按照500個IP地址、3 min ping測1次,存儲結(jié)果1個月將到達720萬條,3個月將超過2 000萬數(shù)據(jù)。本方案設(shè)計數(shù)據(jù)庫模型時采用按月建表,減少因數(shù)據(jù)量大而導(dǎo)致的讀寫速度慢的情況,提高業(yè)務(wù)試用感知。
本項目下期將引入人工智能(Artificial Intelligence,AI)算法,基于統(tǒng)計的大量數(shù)據(jù),采用決策樹或神經(jīng)網(wǎng)絡(luò)算法,對用戶網(wǎng)絡(luò)質(zhì)量進行基于AI算法的分析,實現(xiàn)預(yù)測用戶網(wǎng)絡(luò)質(zhì)量情況,對用戶業(yè)務(wù)及運營商的運行維護實現(xiàn)參考和指導(dǎo)。
(1)本系統(tǒng)自主開發(fā)大屏展示,所展示內(nèi)容和數(shù)據(jù)可以基于客戶需求進行個性化展示;
(2)報表展示的核心是個性化算法的提供,可以根據(jù)客戶實際需求進行算法開發(fā);
(3)項目融入自動化運維理念,后期可擴展多種自動化運維功能,且可實現(xiàn)快速迭代開發(fā)及部署。
本項目融入DevOps理念實現(xiàn)項目高質(zhì)量、短時間的快速迭代開發(fā),基于自主研發(fā)的云平臺,對整個項目實現(xiàn)了全流程管理,為項目的DevOps提供全流程管理保障。
山西電信某客戶選擇使用電信數(shù)百條專線電路,但是每月均抱怨電路有中斷、網(wǎng)絡(luò)質(zhì)量差等情況,提出高額索賠。但是,按照客戶所提供的時間點、故障點進行故障排查,且經(jīng)過專人監(jiān)測相關(guān)電路,均未發(fā)現(xiàn)有任何故障。
為了更好的服務(wù)客戶,經(jīng)過深入了解,客戶所提及“故障”為客戶側(cè)軟件監(jiān)測結(jié)果;而電信側(cè)的判斷標(biāo)準(zhǔn)為運維側(cè)出具的(設(shè)備側(cè))“無故障”報告
由此,通過自主研發(fā)提出“統(tǒng)一度量衡”的工具,即網(wǎng)管專家產(chǎn)品,來實現(xiàn)雙方測量標(biāo)準(zhǔn)的統(tǒng)一。網(wǎng)管專家可用于局域網(wǎng)網(wǎng)絡(luò)質(zhì)量、互聯(lián)網(wǎng)質(zhì)量的監(jiān)測,對網(wǎng)絡(luò)質(zhì)量進行實時監(jiān)測,為網(wǎng)絡(luò)故障分析、網(wǎng)絡(luò)運行質(zhì)量分析提供數(shù)據(jù)依據(jù),為運維工作提供有力保障。
經(jīng)過幾個月的測試,雙方對監(jiān)測結(jié)果達成一致,且經(jīng)過對故障的分析及判斷,解決了實際網(wǎng)絡(luò)中發(fā)現(xiàn)的諸多問題,提升了客戶滿意度,也成功完成了客戶業(yè)務(wù)的續(xù)簽,為企業(yè)增收貢獻科技實力。