葛志剛,張永紅,侯永濤(.中國聯通浙江省分公司,浙江杭州 0000;.中國聯通蘭州分公司,甘肅蘭州 70000;.中訊郵電咨詢設計院有限公司,北京 00048)
隨著信息產業的高速發展,通信運營商的業務范圍不斷擴展,傳統的通信機房融合了信息及IT 等業務服務,成為綜合的信息及通信(ICT)業務機房。ICT 技術發展和業務需求的快速提升,機房用電量、功率密度和發熱量急劇增加,配電和空調系統更趨龐大,日常運維管理更加復雜,對ICT 機房的配電管理、熱管理以及空間管理等方面,提出了更高要求。因此,建設高質量的基礎設施監控管理系統,對于ICT 機房安全可靠、高效智能的運行,具有重要的意義。
ICT 機房基礎設施主要包括保障通信設備和IT 設備正常運行的變配電設備、機房環境、各類電力變換設備、后備電池、門禁系統和視頻系統等,為實現對相關設備及機房環境的實時監控,ICT 機房大多建設了動環、門禁、安防等諸多監控系統。
由于不同ICT 機房運營商建設管理和運維管理體系不同,所建設監控系統的種類以及監控對象會有較大的差異。就中國聯通而言,不同省份、不同管理部門的建設模式也同樣存在較大差異,如對于動環監控系統,根據行業標準《通信局(站)電源、空調及環境集中監控管理系統》(YD/T 1363)的規定,動環監控系統可以涵蓋高低壓設備、能耗、視頻、門禁等諸多監控對象,中國聯通大部分省份遵循了這種建設模式。還有部分省份則將動環監控僅僅定義為對電力變換設備、單元式空調和機房環境的監控,其他監控對象則分屬不同的監控系統,如機房視頻和機房門禁作為安防系統建設,歸屬安保部門,機房維護人員無法實現機房視頻和門禁等的管理,一般將此類動環監控系統稱為狹義的動環監控系統。實際上,各通信運營商對監控系統的分類,都存在相同的情況,不同省公司,甚至同一省公司不同部門的建設模式各不相同。
表1 所示為目前ICT 機房基礎設施監控系統建設時,相關監控對象和監控系統歸屬關系。

表1 ICT機房基礎設施監控對象及監控系統歸屬
當前,不同的監控行業制定了不同的國家標準或行業標準,這些標準都是針對單一行業編制,關注某一個特定的應用場景,如視頻監控、樓宇自控系統(BA)等。而ICT 機房的各類基礎設施應作為一個整體考慮,不同的監控對象之間不是孤立的,而是存在千絲萬縷的聯系的。為解決這一問題,目前通常方案是建設一個ICT 基礎設施綜合監控平臺,各子系統接入綜合監控平臺,對相關子系統進行整合,在統一的基礎設施監控平臺實現數據共享,進行大數據分析,實現智能(AI)運維和運營,使整個基礎設施系統安全、高效地運行。
當前基礎設施監控系統建設方案通常是,先建設不同的監控子系統,再將不同的子系統融合,接入統一的基礎設施監控平臺(也稱基礎設施綜合網管)。各個被監控設備到現場監控采集設備的通信口,稱為A 接口;現場監控采集設備到各監控子系統監控平臺的通信口,稱為B接口;各監控子系統監控平臺到基礎設備監控平臺之間的接口,稱為C接口;基礎設施監控平臺到其他系統的接口,如通信運營商的資管系統、傳輸網管等,稱為D接口。這種建設模式是當前建設的主流,但也存在諸多問題,阻礙了基礎設施監控系統建設的順利實施。
A 接口是監控對象的通信接口,目前在通信行業中,YD/T 1363 規定了A 接口的通信協議,通信行業廣泛應用的UPS、開關電源、高壓直流電源以及單元式空調等設備普遍采用了該接口協議,保證被監控設備能夠快速接入監控系統,降低了接口協議接入開發成本。而對于非通信行業專用的設備,如高低壓配電、柴油發電機組等設備,A 接口仍處于無章可循的局面,監控工程實施時,需要監控廠家技術人員對此類設備進行接口協議的解析和調測。對于大型ICT 機房而言,需要對大量的被監控設備一一解析,造成人力和財力的巨大浪費,減緩了工程實施進度。
B 接口指各類監控采集設備的北向接口,由于B接口長期沒有相應的規范,不同監控廠商的B 接口協議也不相同;在工程實施時,B 接口協議往往與監控廠家的監控平臺高度耦合,使監控采集設備B 接口為該廠家獨有,造成監控工程后期擴容、原有老舊監控采集設備更換的壟斷。一旦原有監控廠家不再進行技術支撐,已建的監控系統將處于無法維護、最終無法使用的局面,造成投資的浪費,也為基礎設施安全運行埋下隱患。
不同監控系統采用單獨建設的模式,該模式存在諸多的問題。
a)不同監控系統之間,存在監測點的重復和被監控設備通信接口利用的沖突,不僅浪費投資,也會對各監控系統的順利實施產生阻礙。如動環監控和空調群控,都需要對空調運行和機房環境進行監控;動環監控和能耗監控,都需要利用配電設備的通信接口獲取監控信息。部分子系統分建,會造成子系統監控資源浪費,以及對被監控設備通信接口占用的沖突。
b)監控子系統單獨建設,無法數據共享,無法實現重要事件的聯動。如關鍵設備告警、機房水浸、火災等重要告警信息,無法與視頻系統聯動,無法及時記錄告警現場影像,不利于告警事件追溯,也不利于高效處理現場故障;高低壓配電和電力變換設備告警,如果分屬不同的監控系統,無法快速評估高低壓故障、維修對后續相關電力變換和配電網絡的影響,也無法在電力變換設備發生停電故障時,及時準確地追根溯源。
c)不同監控子系統單獨建設,采用各系統專用的監控采集設備、交換和傳輸設備,由于只是對應單一的監控子系統,監控采集設備、交換和傳輸設備配置的接口往往存在盈余,在傳輸線纜大量采用光纖的情況下,各系統分建傳輸,傳輸帶寬也會大量浪費。多監控系統分別安裝設備、布放傳輸線纜,耗費大量的工程費用。
當前,建設統一的基礎設施監控平臺,需要采用C接口從各監控子系統獲取監控信息,由于子系統涉及行業和廠家眾多,C 接口沒有統一的規范要求,部分工程實施時,少數子系統監控廠家甚至不提供C 接口協議,極大地阻礙了基礎設施監控系統的建設進度。通過C 接口接入,在基礎設施監控平臺發生監控信息缺失、錯誤告警和遺漏告警時,也會增加查找原因的難度。
目前,各家公司基礎設施監控平臺的數據庫存儲結構和系統軟件功能也不統一,業內也沒有相關的標準可循。
a)監控系統關注點從點到面、從關注單個孤立設備安全運行到整個基礎設施系統的安全、高效運行,從單個孤立系統到多系統融合、海量數據共享、大數據分析和AI智能輸出,這一切都依賴于翔實、準確、開放的監控數據,而各監控廠家私有化的數據庫無疑成為實現這一目標的壁壘。缺少海量數據共享,監控系統的智能化分析將無從談起。
b)除了監控數據實時監控、準確告警、數據存貯等功能,監控系統的軟件功能可以分為2類。
一類是根據監控系統運營方制度和運維人員要求,定制開發的運維管理和運營流程,是監控系統的重要組成部分。
另一類則是根據基礎設施的組成、系統結構和運行數據,進行理論分析、數學建模,最終實現AI智能輸出,尤其是對供配電、熱管理以及空間等基礎設施的重點環節進行優化管理,實現系統高效運行,準確預警,提高基礎設施運行的安全性。在今后較長的時期,這類功能必定是基礎設施監控系統開發的重點和難點。由于當前對于監控系統軟件功能缺少完善的評估機制,目前部分監控廠家往往以此為噱頭,進行夸大宣傳和概念展示,而工程實現則是偷換概念或淺嘗輒止,擾亂了監控市場的健康發展。
ICT 基礎設施監控系統的標準化建設包括數據采集、通信接口、傳輸、標準化數據庫和系統功能第三方評估等方面。
ICT 機房基礎設施包括各類變配電設備、電力變換設備、空調設備、機房環境、門禁和視頻監控等,從原理上看,除了視頻監控采用專有的圖像編解碼技術,其他監控系統的底端采集設備接口都是由各類通信口、模擬輸入AI、數字輸入DI和數字輸出DO等組成,這些接口具有國際標準,技術上是統一的,不同的監控采集設備在物理接口方面可以完全一致。在工程實施中,不同的監控系統應采用標準化的、通用的監控采集設備,完成所有基礎設施監控對象的接入,實現采集設備的統一。
在統一監控采集設備基礎上,應標準化監控采集設備的B 接口類型和B 接口協議。目前,部分通信運營商制定了B 接口通信協議,約束監控設備廠家的采集設備,使不同廠家的監控采集設備可以混合組網,互相替換,同時實現監控采集設備和監控中心平臺軟件的解耦。
目前,中國聯通已經頒布實施了動環監控B 接口企業標準,并在部分省公司得到實際應用,實現了不同廠家監控采集設備混合組網、接入第三方監控中心平臺軟件。中國聯通B 接口協議內容涵蓋了當前ICT 機房應用的主流動力設備、機房環境及其監測點,并制定了靈活擴充被監控設備和監測點的規則,用于可能出現的新型設備和新增監測點,可以滿足ICT 機房基礎設施監控系統被監控設備和監測點的標準化需求。
圖1所示為基礎設施監控系統標準化建設網絡結構,其中,消防系統屬于國家強制要求必須單獨組網;空調BA 系統短時間內仍處于少數幾家國外公司壟斷局面,也采用單獨組網。其他所有的監控系統,都采用共用監控采集設備和傳輸進行整合,將極大降低工程投資。同時,消防和空調BA 仍采用先建設子系統、再接入基礎設施監控平臺的模式。在ICT 機房基礎設施監控平臺,根據需求定制開發不同的軟件功能模塊,實現對機房基礎設施的綜合管理。

圖1 基礎設施監控系統標準化建設結構
當前各監控系統的數據庫結構為廠家私有,若私有數據庫接口不開放,不可能實現前期已經獲取監控數據的共享。因此,在保留原有廠家私有數據庫前提下,制定標準的中間數據庫,監控系統在正常運行時,將運行數據同時寫入標準化的中間數據庫,方便第三方調取使用;同時,該數據庫也可以作為監控廠商私有數據庫的備份。
與ICT 行業大量使用的單元式空調、電力變換等設備不同,各類監控系統沒有入網檢測,缺少專業的檢測標準和檢測機構對監控系統進行測試評估,在工程招標時只能依靠投標廠家的技術應答、廠家規模、以往業績和報價等因素,選擇中標方,缺少可量化的技術指標約束,最終往往是低價中標,最終導致整個行業處于低研發投入、低水平競爭、劣幣驅逐良幣的局面。
因此,制定系統軟件性能測試要求,細化測試項目、測試指標、測試方法和測試分級,開展可量化的第三方測試,公開評測監控廠商軟件平臺性能,從系統穩定性、數據分析準確性、系統響應實時性以及智能化程度等方面,進行科學地評判,改變當前僅靠廠家宣傳和技術應答書進行技術評價的現狀。
ICT 機房基礎設施監控系統應遵循標準化建設先行、智能化分析為發展重點的原則,制定相應的監控系統建設規范,實現監控采集設備、接口協議以及中間數據庫的通用性,搭建起完善的數據采集平臺,為智能化分析提供翔實、可靠的數據源。
a)不同系統共用底端采集設備和傳輸,執行開放的北向接口,可極大降低建設投資,實現監控中心平臺軟件和底端采集硬件的解耦。
b)建設統一的監控中心軟件平臺,制定標準的中間數據庫,按需求定制不同的軟件功能模塊,實現數據共享、多系統融合和監控系統的快速聯動。
c)在監控數據全面、準確的基礎上,進行深度數據挖掘、分析,以供配電、熱管理和空間管理等方面為重點,完善基礎設施數學建模,輸出智能化決策,真正實現ICT機房基礎設施安全可靠、智能高效的運行。