張楠
上海建筑設計研究院有限公司 上海 200041
數據中心場地設施包含電氣、暖通制冷、消防、安防等眾多子系統(tǒng),設備種類繁多、功能各異。為提高數據中心智能化管理水平,實現綜合信息管理的“大數據式運維”,將各子系統(tǒng)數據集成于統(tǒng)一的場地設施監(jiān)控管理平臺上,實現各子系統(tǒng)間實時互連互通、信息共享,以便全面分析、掌握場地設施的運行信息、預見潛在故障、指導運維操作、輔助遠期決策,從而實現運籌帷幄、統(tǒng)一指揮,提高場地設施運行穩(wěn)定性、安全性、可靠性的管理目標。近期出臺的GB50174-2017《數據中心設計規(guī)范》強制性國家規(guī)范中,也對數據中心的環(huán)境和設備監(jiān)控提出了明確的要求,充分說明了綜合監(jiān)控系統(tǒng)在數據中心建設中的重要性。
本文主要以綜合監(jiān)控系統(tǒng)中模塊化架構為例,介紹其在某數據中心建設中的應用情況。
某數據中心建設項目,機房建設面積約1000平方米左右,機房區(qū)域位于大樓一層,ECC數據中心總控中心、應急指揮室位于大樓二層。一層包括以下功能區(qū):UPS配電間,電池間,IT機房、電信間、消防鋼瓶間、工作間,參觀通道等;二層包括以下功能區(qū):ECC數據中心總控中心、應急指揮室。總體規(guī)劃共161個機柜。
根據設計要求,設置數據中心綜合監(jiān)控系統(tǒng),集中監(jiān)控場地設施工作狀態(tài),及時了解數據中心的全面運行狀態(tài)。

系統(tǒng)基于網絡分布式部署,運維網絡內的任意一臺或多臺集成工作站,運維人員權限相同時,系統(tǒng)將以相同的界面操作,管理整個機房權限范圍內的子系統(tǒng),并具備授權的所有操作功能。
數據采集層
數據采集處理層設計為系統(tǒng)的數據入口,是系統(tǒng)管理所需基礎設施數據的來源,其通過架設嵌入式采集服務器,接收前端系統(tǒng)(如:電力監(jiān)控系統(tǒng)、暖通制冷監(jiān)控系統(tǒng)、安防系統(tǒng)、消防系統(tǒng)等)的監(jiān)控數據。然后由采集服務器將數據匯總到上端集中處理平臺。
嵌入式采集服務器具備獨立的機房實施監(jiān)控功能,具備完整的數據采集、數據存儲、數據分析功能,采用嵌入式服務器的優(yōu)勢在于將數據的采集分析交付于前端完成,相對于串口服務器版本,可極大的降低后端系統(tǒng)負載,提供系統(tǒng)容量及可靠性,同時系統(tǒng)的獨立特性在網絡中斷時可在本地提供基本監(jiān)控功能,保障監(jiān)控持續(xù)不中斷。
數據管理層
數據管理數據管理通過架設兩臺管理服務器來實現真?zhèn)€平臺的數據管理及數據展示功能,提供包括數據分析、設備監(jiān)控、2D/3D展示等功能。同時針對金融客戶對安全的高要求,我方系統(tǒng)采用雙機冗余設計,主備服務器相互監(jiān)測,任一一臺服務器宕機不影響系統(tǒng)正常運行,系統(tǒng)切換無需人工干預。
系統(tǒng)提供獨立的告警網關服務器,可通過短信、電話、聲光、郵件等方式向用戶推送告警信息。后續(xù)也可擴展對接用戶短信告警平臺或其他告警管理平臺。
數據展示層
展示層提供豐富的展示媒介,提供友好的用戶交付界面。隨著應用設備的發(fā)展,根據應用需要,在應用層增加相應的展示模塊,即可實現多樣的展示方式。

綜合監(jiān)控系統(tǒng)具有功能多樣、可靠性高、穩(wěn)定的特點。通過實時與基礎設施通訊交互、智能分析控制,人性化界面展示讓運維人員及時了解數據中心健康狀況,保證數據中心安全運營。通過全面的信息進行定位故障根源,屏蔽關聯告警,避免一次出現大量告警誤導運維分析,提高運維效率。通過對系統(tǒng)可用性的不同影響程度進行分級告警,杜絕以前單個測點判斷故障帶來的片面性。通過大數據分析實現趨勢判斷、系統(tǒng)隱患發(fā)現,做到事前預防、輔助遠期決策。
主要功能包括:(1)低壓配電監(jiān)測(三相及各相電壓、電流、有功功率、無功功率、頻率、功率因數、視在功率、有功電度、無功電度等參數進行數據采集;系統(tǒng)能對開關狀態(tài)進行實時監(jiān)視)(2)UPS監(jiān)測(模擬量的監(jiān)測,主要包括:輸入電壓、輸入電流、輸入頻率、負載電壓、負載電流、負載頻率、旁路電壓、旁路電流等。(3)精密空調監(jiān)測(溫度、濕度、溫度設定值、濕度設定值、空調運行狀態(tài)、風機運轉狀態(tài)、壓縮機運行狀態(tài)、加熱器加熱狀態(tài)、加濕器加濕狀態(tài)、壓縮機高壓報警、風機過載、除濕器溢水、加熱器故障、氣流動故障、過濾器堵塞、制冷失效、加濕電源故障、壓縮機低壓報警、壓縮機高壓報警等(4)溫濕度監(jiān)測(系統(tǒng)能實時監(jiān)測機房內的溫度值和濕度值)。(5)漏水監(jiān)測(系統(tǒng)能實時顯示并記錄漏水線纜感應到的漏水狀態(tài))(6)蓄電池監(jiān)測(電壓監(jiān)測、內阻監(jiān)測、電流監(jiān)測、溫度監(jiān)測、異常報警、內阻監(jiān)測、自動編址)
主要功能包括:系統(tǒng)采用雙機熱備模式,利用“雙監(jiān)控系統(tǒng)+雙數據庫”模式,平臺架設二臺集中監(jiān)控管理服務器,分為集中監(jiān)控管理主服務器、備份服務器(主備服務器內均含數據庫),同時架設一套磁盤陣列,將數據庫文件內容即監(jiān)控數據存放在磁盤陣列中。
系統(tǒng)設置兩臺服務器分別作為主、備機,同時系統(tǒng)虛擬一個服務器,兩臺的物理的服務器和一臺虛擬的服務器通過一個內核模塊相互連接。系統(tǒng)對外提供虛擬服務器的IP地址供客戶端訪問。
當主機運行正常時虛擬主機與主機相連,一旦主機宕機以后,利用內核模塊虛擬主機自動與備機相連。整個過程無需人工干預,切換時間小于10秒,同時對前端的所有操作沒有任何影響。當主機恢復后,備機自動釋放主動權,并對這段時間所產生的數據與主機進行同步。

主要功能包括:(1)PUE指標計算(2)子系統(tǒng)能耗展示(3)指標計算
主要功能包括:系統(tǒng)給予不同角色擁有自己對應的個人工作臺,在工作臺中,顯示自己關注或與自己相關的監(jiān)控管理工作,以便只要打開DCIM客戶端,就能立即查看自己所關心的、自己所要做的工作。
不同的用戶角色,不同的權限看到不同的內容,執(zhí)行不同的操作。個人工作臺會把和每個人相關的任務推送給他,也會把執(zhí)行任務所需的信息和他所關注的信息推送給他。進入個人工作臺就能夠完成任務,當需要更多信息時才進入到各個模塊中。
基于對用戶的管理,系統(tǒng)在展示界面中以“個人工作臺”體現角色的分配,根據人員所處的“管理”、“決策”、“執(zhí)行”層級自行定義用戶的工作臺界面。
主要功能包括:(1)基本告警功能(2)告警統(tǒng)計(3)告警事件生成(4)告警聯動(5)告警分配(6)告警展示(告警過濾、報表管理功能、遠程管理功能、容量管理)
主要功能包括:(1)數據中心場景導航與展示(2)場景漫游(3)基礎設施監(jiān)控報警與定位(4)3D交互-測點信息查看(5)3D虛擬巡檢:系統(tǒng)內建虛擬巡檢任務,按預設巡檢路線對機房設備進行巡檢。
數據中心具有一定復雜性,隨著業(yè)務的不斷發(fā)展,管理的任務必定會日益繁重。所以在數據中心的設計中,建立一套全面、完善的機房管理和監(jiān)控系統(tǒng)是十分必要的。綜合監(jiān)控系統(tǒng)作為一種實時監(jiān)測預警系統(tǒng),在數據中心中被廣泛應用,其簡單的系統(tǒng)架構有效的實現了數據中心基礎設施的實時監(jiān)測,并反映出設備的實時工作狀態(tài),保障了數據中心的正常運行。