孟翔,劉曉杰
(中國廣電山東網絡有限公司濰坊市分公司,山東 濰坊 261061)
在“互聯網+”時代背景下,社會中的業務數量也在快速增長,對于網絡傳輸效率、傳輸質量也提出了新要求。集群光傳送網便是在集群多子框架技術的基礎上發展而來的新型網絡,將其應用到OTN 設備管理系統中,有助于各項業務的不斷拓展,持續提升系統的業務承載能力,以提高設備管理過程的及時性與可靠性。
集群是一種用于集團調度指揮通信的移動通信系統,主要應用在專業移動通信領域,該系統具有的可用信道可為系統的全體用戶共用,具有自動選擇信道功能,它是共享資源、分擔費用、共用信道設備及服務的多用途、高效能的無線調度通信系統。此類架構在應用中的突出特征便是使用信道動態分配模式來完成通信,用戶具有不同的優先級與特殊功能,可在同時間內完成多渠道通信,提高設備的執行效率。現階段,市場中流通的集群技術包括TETRA、iDEN、GoTa、GT800 等。
2.1.1 數據采集模塊
確保設備管理效果的基礎保障,便是采集豐富且完善的應用數據。在該模塊的具體工作中,所采集的數據信息類型如下:(1)設備故障庫數據,其內容包括設備定義數據、設備基礎數據、設備常見故障數據庫等,以此來作為建立設備故障樹的重要參考,來源于設備的日常運營信息。(2)設備歷史故障數據,此類數據主要來源于設備缺陷記錄和設備以往的檢修清單,這些數據也會在故障模式下進行概率計算,同時,也會對故障停機時間、修復時間等內容進行記錄,便于故障檢修規律的探索。(3)建立評價模型對設備結構與故障模式重要性展開分析,這也確定了故障檢修時的優先級排序,以提高所建立模型的利用價值。(4)故障概率修正參數作用是可以用來對各個設備層故障概率進行修正,便于設備養護計劃的及時擬定。此類數據的主要來源是役齡與修復性事件中所整理的數據。
2.1.2 查詢/預警模塊
在OTN 設備管理系統的應用中,需要定期查詢各個設備的查詢與預警性能是否可以正常使用,而設備在收到指令后則會對相關性能進行自查,根據得到的反饋數據了解目前設備工作狀態的穩定性,針對存在的異常問題,也會及時作出處理,以保證設備運行狀態的穩定性。一般情況下,系統不會主動下達輪詢命令,一般都是工作人員通過網管上的“同步告警/性能”按鈕來下達查詢命令,設備在接收到命令后開始進行自檢。而過程中的相關數據需要通過協議緩沖區封裝后,再直接將數據包傳遞給網管,而性能數據則是利用文件傳輸協議直接上傳給網管,最后會由子框框控盤來對這些數據進行采集和整合,直接上報給主控盤展開進一步處理。
2.2.1 擴展子框管理
在OTN 設備管理系統的框間管理模塊的設計上,需要做好擴展子框管理工作,在主控盤接收到相關數據后,會根據采集的框號來判斷出其是否屬于本框單盤,若是判斷出并不是本框上的信息,則會基于集群技術將其輸送到對應位置。而且主框位置處也會配置相應信息,對于各類子框告警信息也將直接發送到各類子框框控盤,由各個框盤來完成告警燈點亮的操作。并且在集散架構的支持下,也會在整個結構中增設擴展子框功能,以此完成各類信號的管理工作和運轉工作。另外,在整個子框的應用中,系統也能夠支持設備進行共同組網,以滿足各類信息的處理要求,提高信息處理結果的可靠性。
2.2.2 主備框配置同步
結合集群架構來對設備系統運行過程進行設計時,也需要做好主備框配置同步設計工作,并且在設備主備框工作期間,也需要定期檢測的方式來判斷對方工作狀態是否處于正常狀態。而且備框結構也會定期向主框結構發出配置校驗,并請求結構可以同步,通過同步校驗幀中篩選出存在未同步的配置數據,而此時主框主控盤也會將自身配置借助通道直接同步到備框的框控盤中,而此狀態下,主框控盤和備框控盤也需要進行同步處理,保證所有傳遞信息的同步性,滿足信息序列的傳遞要求。
2.2.3 框間切換
在整個工程應用活動中,如果主控盤出現了運行故障,將會造成整個主框與站點處于托管的狀態,而且也將帶來整個環路出現托管的情況。對此,依托集群架構來處理此問題時,可以在系統中增設主備框切換功能,而用到切換方式如下:(1)進行手動切換,在網管下達切換命令給備框后,此時,備框也會在接收到命令后自動切換成主框,而原來的主框結構則變成備框,那么,在此情況下,新的主框也會將切換事件直接上傳到網管,并且向網管提交相應的申請配置。(2)自動切換,此類切換方式在應用中,主要通過對心跳數據的檢測來判斷主框是否處于正常運行狀態,備框在運行中會定期向主框結構發送心跳數據,主框在收到相關信號后會進行應答,若是累積三次沒有出現應答,則表示主框出現運行問題,那么此時備框則自動升級為主框。反之,主框在發現自身無法向備框進行應答時,主框結構也會自動切換成備框,完成切換處理后,新的主框也會將事件上報到網管處進行備份。
在設備日常運營中,受到人為因素、環境因素、設備因素的影響,容易帶來設備運行故障問題,威脅到設備的使用壽命。因此,在系統設計中,需要做好維修管理模塊設計,以降低設備故障帶來的影響,延長設備的使用壽命。在該模塊的運行中,主要包含以下幾個階段:(1)維修響應階段,根據系統上傳的相關數據來確定設備是否存在故障,并且在故障發生后也會借助在線故障定位技術,確定設備故障的具體位置。隨后通知維修人員前往現場進行維修。(2)維修進行階段,借助5G通信技術建立現場直播,對設備實際故障數據進行采集,錄入系統中,會對故障出現原因進行分析,對比數據庫中以往的故障檢修內容,來確定對應的設備維修方案。(3)完成故障維修后,開始進行維修總結與細化分析,同時,對整個維修過程進行論證,所得到的論證結果會直接錄入數據庫中,作為下次檢修時的方案參考。
基于集群架構所建立的OTN 設備管理系統管理著多組設備,為了便于管理體系的不斷完善,在實際應用中也需建立統計報表模塊,用作各類數據的優化整理,提升所整理數據的應用價值。利用系統來整理設備日常運行記錄、設備維修記錄和設備變動記錄等內容,在系統中也會自動生成各類報表與趨勢圖,常見的圖表類型包括設備總效率報表、故障動態統計報表、故障停機率報表、設備MTTR 和MTBF 報表、設備利用率報表、設備完好率報表及設備閑置率報表等各種報表和趨勢圖,依據時間、分類來對這些數據進行整理,從而為設備管理者提供更加直觀的決策數據,以提高所統計數據的科學性與合理性。
本次招標標的共新建40×10G OTN 密集波分系統9個,覆蓋162 個節點(包含9 個中心局點),投標時按照全需求進行投標,本項目將根據網絡情況分期建設。在方案建設中,各段都需要保留適當余量,而光纜的衰減值則根據0.3db/km 來進行計算。
在此次系統的建設中,各個節點的業務需求情況如下:(1)在線路容量的設計上,該覆蓋區域的所有縣鄉環網需參考40 波×10G 系統來進行布置,而且各個節點位置的設備,需要滿足不低于5 個波的接入能力,同時需要具有較強的擴展能力,在需要的情況下,可擴展成單波40G、100G。(2)設置可靠保護方式,在網絡保護方式的設計中,需要利用光通道1+1(線路側端口1+1)光來進行保護,若是光纖資源出現了中斷問題,那么,另一組網絡能夠在50ms 內完成替換,維持系統正常運行。(3)科學設置節點設備,在區域的中心點位置需要布置OTN 傳輸設備,該設備使用-48V 直流來進行供電,同時需要在鄉鎮節點位置布置較為緊湊的OTN 傳輸設備,這些設備需要使用220V 交流來進行供電。(4)合理布置光模塊,所有布置的光模板都需要使用固定波長來傳遞信號,而GE/10GE 客戶側則需要設置單模光模塊,確保信息的穩定傳輸。
3.3.1 系統基礎內容
在此次設計的OTN 設備管理系統應用中,主要借助C/S 結構或B/S 結構來進行信息傳輸管理,所使用到的系統運行協議為ITU-T 協議,硬件方面則使用了G.774 系列和M3100 系列。而且該系統的其他細節如下:(1)該系統具有開放度較高的接口,而布置的網管系統在應用中則提前設置了兼容性接口,能夠滿足多數信號的傳輸要求。(2)所布置的網管系統擁有較為先進的應用功能,可以提供清晰的用戶界面,同時,提供了軟件下載功能,利用系統后期擴展。(3)此系統在應用中共有集中式管理和分布式管理兩種模式,前者是在設備檢測時下達統一指令,進行統一調度;后者則是在日常工作時,以各個縣鄉為管理節點,進行系統工作狀態管理。(4)設置的系統對網絡運行過程,可以給予在線監督,而且在波分網元管理系統(EM)輔助下,可滿足系統管理需求。
3.3.2 實驗校核內容
在實驗校核中,所校核的內容如下:(1)預警功能,在仿真平臺上設置訓練集,訓練集中包含1300 個故障點信息,隨機抽選150 個故障點作為實驗組,混入850 個正常數據中,隨后錄入系統中,查看系統是否可以準確識別出異常信息,并做出預警動作。(2)故障自動處理功能,校核發現故障問題后,系統是否可以根據已有數據信息來自動確定故障原因和故障位置,對于可系統自行處理的故障,是否可以自主完成處理。(3)通知方式靈活性,對于發現的故障問題,是否可以通過多渠道通知到檢修部門,整個過程的靈活性與及時性都是考驗指標。(4)多級用戶分權管理,系統是否可以根據預設的等級分設要求,完成用戶的等級劃分,并匹配相應權限。(5)全方位的監視功能,是否可以從多個角度獲取全面的數據信息。
實驗所得的檢測數據如下:(1)預警功能,根據統計得到的數據可以得知,系統準確識別出147 個故障點,準確率為98%,滿足系統的安全預警要求。同時系統在準確識別出異常信息后,可以及時作出預警動作,滿足系統安全預警要求。(2)故障自動處理功能,根據數據可以得知,發現故障問題后,系統可以根據已有數據信息在50ms 內做出響應,自動確定故障原因和故障位置,對于可系統自行處理的故障,會及時下達調整指令,實現問題的快速解決。(3)通知方式靈活性,對于發現的故障問題,系統會在50ms 內通過移動端、控制顯示屏、預警信號燈等方式通知到檢修部門,整個過程的靈活性與及時性較高。(4)多級用戶分權管理,系統能夠根據預設的等級分設要求,完成用戶的等級劃分和權限匹配。(5)全方位的監視功能,能夠從多角度完成不同監測信息采集,利于系統決策活動的推進。
綜上所述,在OTN 設備管理系統建設過程中,集群技術擁有良好的應用價值,通過整理基于集群架構的OTN 設備管理系統建設要點,能夠積累相應的建設經驗,這也為系統下階段開發活動的推進奠定了良好的基礎。