張亞南,韓冰洋
(北京中電飛華通信有限公司,北京,100070)
由于當今和未來電力系統中IT/OT的日益融合,新的信息源可以實現更復雜的監控和控制應用程序。特別是數字孿生技術,它是具備強化建模,分析和預測功能的關鍵技術。為了保證電力系統的安全運行,電力行業普遍采用專用的網絡模式進行網絡資源管理。然而,隨著物聯網和信息技術在電力領域的快速發展,電力行業的通信機房規模和數量正在迅速增加,導致日常運維的工作量和復雜性急劇增加。因此,迫切需要利用信息技術來實現對現有機房的智能化運維、監控和管理,以更好地保證電力行業的健康發展和穩定運行。但是,當前電力通信機房管理、運行維護的方法仍然較為傳統,每個機房尚未實現對設備的集中監控,智能分析和預測報警,這使得網絡控制室值班人員無法監控信息系統的整體運行狀況。因此,他們既不能有效地分配和優化信息資源,也不能保證信息系統的可靠運行。顯然,這不能滿足智能電網建設工程的需求。國外很多研究機構已經對機房智能化運維進行了相應的研究,如林雪平基于B/S模式開發的核電站診斷與演示系統,瑞士ABB公司的電力設備遠程監控系統等,以及由加拿大Granby公司設計和開發的用于通過以太網對機器工具進行診斷的遠程監控系統。西安電子科技大學,中國華能集團等國內相關單位也在這方面進行了研究,例如HG系列機房綜合監控系統軟件,“飛思網巡”機房監控管理系統等。這些系統實現了電力設備運維支撐的功能,提高了中國電力行業信息管理業務的效率和質量。但是,這些系統主要是分配,維護和管理網絡資源,用于機房運行狀態監視和運行維護管理的系統在文獻中很少報道。本文將基于數字孿生通信機房智能運維系統,開展通信機房設備、配套設施三維建模研究以及通信機房設備實時數據接收與狀態仿真模擬展示研究[1]。
在向工業4.0的數字化轉型的時代,制造和生產過程都處于最前沿。為了實現這種數字化轉型,需要將現實生產世界和數字化生產世界融合在一起,所有部分都相互連接,包括傳感器,機器,產品,系統,過程和人員。在這方面,網絡物理系統,數字基礎設施和專用軟件可以對生產過程中包括的物理資產進行連續監控。這有效促進了事件檢測,并實現了生產資產和流程的模擬和優化,從而為相關人員提供了明確的決策支持。數字孿生(DT)是這種數字轉換的重要推動力,它定義了物理世界向數字領域的虛擬轉移。數字孿生技術可以為當代生產系統提供許多功能。基礎數字孿生架構如圖1所示,主要包括物理空間、虛擬空間以及這些空間之間的連接三部分[2]。

圖1 基礎數字孿生架構
數字孿生可以通過創建一個連接的物理和虛擬孿生來解決物聯網與數據分析之間無縫集成的挑戰。數字孿生環境允許快速分析和通過精確分析做出實時決策。自21世紀初以來,關于數字孿生的正式想法就已經出現。也就是說,我們有可能更早地定義數字孿生。第一個術語是由Grieves在2003年的一次演講中提出的,后來在白皮書中進行了記錄,為數字孿生的發展奠定了基礎。美國國家航空航天局(NASA)在2012年發表了一篇題為《未來美國航空航天局和美國空軍飛行器的數字孿生范例》的論文,為定義數字孿生樹立了一個重要的里程碑。文獻3描述:“數字孿生是物理設備或系統的計算機模型,它代表了所有的功能特征和與工作元件的聯系。”文獻4描述:“數字孿生實際上是物理資產或系統的生命模型,它基于收集到的在線數據和信息不斷適應業務變化,并可以預測相應的物理對等物的未來。”文獻5描述:“數字孿生是一組虛擬信息,它從微觀原子水平到宏觀幾何水平,完全描述了潛在的或實際的物理生產。”文獻6描述:“數字孿生是物理系統的虛擬實例,在物理系統的整個生命周期中都會不斷更新其性能,維護和運行狀況數據。”《未來美國航空航天局和美國空軍飛行器的數字孿生范例》論文是NASA的星際飛行器的模棱兩可的定義,也是早期定義數字孿生的論文之一。盡管文獻3和文獻6之間的時間間隔超過6年,但共識仍然是沒有根本或有意義的改變。學術界和工業界都沒有將DT與一般的計算模型和模擬區分開來,未來的工作需要對數字孿生做出更明確的定義。
通信機房作為電力通信行業業務運行的中樞系統,具有極高的商業價值,業務的有序開展取決于通信機房的正常運行,而通信機房的正常運行取決于機房中各支撐系統設備及傳感器能否正常工作,一方面需要全方位的手段保證機房各項支撐系統的穩定運行,包括動力系統、空調系統、環境系統、安防系統、IT系統,機房管理人員需要詳盡掌握上述系統的實時運行狀況以及告警信息,實現對機房的精細化管理;另一方面,針對機房設備運行故障告警能啟動運維流程,下發工單至運維人員或代維人員,管理員可對維護質量全方位監督,實現智能化運維管理。如圖2所示為機房運維監控系統架構圖,分為接入層、網絡層、私有云、應用層三層架構。

圖2 機房運維監控系統架構
機房也是數據信息計算、交換和存儲的中心,是數據處理最集中、數據價值最高的核心區域,機房具備強大的數據處理能力、存儲及帶寬資源,安全可靠的機房設施、高水平的維護管理是業務正常運行的必要條件,機房的管理必須能夠全面滿足業務正常運行的各項需求,物聯網應用管理系統在設計之初即充分考慮到機房管理的全方位需求,針對性的對機房的各個系統提出管理方案,系統遵循以下設計原則:
(1)智能化:系統提供智能化處理物聯網數據,通過大數據分析,掌握機房各子系統的運行狀態并預測發生故障的可能性,實現預防性的機房管理,真正做到防范于未然。
(2)兼容性:物聯網網關全面兼容各種傳感器、智能設備、IT設備、網絡設備、安防設備接入,提供機房各類狀態數據的統一入口,僅需一臺物聯網網關設備即可全面兼容各類子系統數據的匯聚及解析。
(3)擴展性:無論部署在機房的物聯網網關,還是部署在云端的物聯網應用管理平臺,均具有彈性拓展能力,在機房內部,用戶可根據被管理設備的類型和數量,選擇物聯網網關及擴展模組實現設備的適配。在云端系統可根據用戶接入機房和設備的規模彈性分配資源,動態地分配業務所需資源。
(4)安全性:系統各組成部分均提供完善的安全防護能力,業務全流程數據采用HTTP Digest加密認證,物聯網網關內置軟件防火墻,并且具備物理隔離能力。視頻監控采用P2P方案,視頻數據不經過平臺點對點傳輸,保證視頻信息安全;物聯網應用管理平臺采用RBAC權限模型,可以精確控制用戶權限,保證用戶權限受控。
(5)可用性:系統具備高可用性,物聯網網關設備具備高性能ARM處理器,能夠對采集的各類設備協議進行現場解析處理,即使與云端平臺通訊中斷,也不會影響物聯網網關本地數據采集、分析和聯動,保障系統的穩定運行。
包含通信機房主要基礎設施三維模型庫,能夠對模型進行增加、刪除、修改、查詢、展示,包括通信設備、網絡設備、配線架、線纜、機柜、空調、UPS、電源等。
(1)告警管理
能夠對信息通信機房整體及設備運行狀態告警進行記錄、查詢、展示、提醒,能夠與巡檢機器人、網管系統的告警功能對接。
(2)運行記錄
支持信息通信機房內基礎設施運行信息的增加、刪除、修改、查詢、數據展示,包括設備上架、更換、下架的時間、設備型號、批次、狀態、投運日期、維修次數等。
(3)動環管理
具備信息通信機房動環系統狀態監測、告警、分析、視頻監控等功能,支持告警提示、數據存儲、圖表輔助分析。
電源系統:具備電源系統狀態監測與展示功能,包括UPS蓄電池剩余電量、負載額度及異常告警、直流配電設備使用情況、狀態監測等。
空調系統:支持空調系統狀態監測與展示,包括溫濕度、工作狀態、告警等。
消防系統:支持消防設備管理、報警信息處理、機房地圖展示、遠程監控、數據統計等。
溫度:能夠展示機房內環境溫度、設備溫度,支持圖表展示。
(4)人員管理
支持人員角色、權限管理,包括工作人員、臨時訪客等。支持與視頻監控、門禁系統對接,實現人員進出記錄、違規進入告警等。
(5)巡更管理
支持與移動端對接,支持巡視計劃制定、指令下達、人員定位、拍照錄像、軌跡回放、巡更打卡、告警、分析、公告管理。
支持信息通信機房內在運設備和板件以及基礎設施等基本信息的增加、刪除、修改、查詢、資產標簽展示,包括規格、批次、出廠日期等。
支持信息通信機房整體、各個機柜的能耗計算與數據動態實時展示,支持圖表、曲線等多方式展示。
包含虛擬互動應急演練庫,支持三維動畫模擬展示通信機房設備故障、網絡故障、突發事故等,建立預案、設置故障、錄制處置故障操作流程、回放錄制預案、故障恢復模擬操作。
本文面向通信機房智能運維需求,采用三維虛擬化技術實現了通信機房的動環監控和機柜智能檢測,滿足數字化移交要求,同時為智能化、精益化運維應用奠定基礎。該系統可以實現對機房環境和機柜相關數據的自動采集,分析和預警處理,對電力信息通信的運維進行了新的探索,提升了通信機房風險預警與故障處置能力,打造通信機房智能管控新模式,為通信機房建設運維提供智能決策支持,有效地提高了運維效率和運行質量。