中圖分類號:TN915 文獻標志碼:A
文章編碼:1672-7274(2025)05-0053-03
Abstract: In data centers,there are a large number of non-linear load devices, which cause the workload of servers to change rapidly with changes in business requirements,therebyreducing the response speed of monitoring instructions.Therefore,the article proposes acloud computing based remote communication and monitoring method for UPS in data centers.Firstly,determine thecommunication target and establish relay nodes tooptimize the selection ofremote communicationports for UPS in the datacenter.Secondlybasedon the port selectionresults,calculate the load variation characteristicsand set theconfidence threshold range for the characteristics.Utilize cloud computing technology to construct a remote communication monitoring model for UPS data in the data center.Finally, a hierarchical monitoring approach isadopted toachieve comprehensive monitoring ofabnormal traffc.The experiment shows that the method has a high sensitivity and accuracy in detecting communication anomalies exceeding the threshold of O.0o2 at all time points; When the total amount of data is 8×1015 TB, the response speed reaches 1.1 s, which is better than traditional methods and significantly improves communication efficiency.
Keywords: cloud computing; data center; UPS; remote communication; abnormal traffic monitoring
數(shù)據(jù)中心不僅承載著海量數(shù)據(jù)的存儲和處理任務,還涉及復雜的電力供應和管理問題。其中,不間斷電源(UPS)作為數(shù)據(jù)中心電力保障的關鍵設備,其遠程通信與監(jiān)控技術的研究顯得尤為重要。如文獻[1]用DSP技術采集、處理和控制視頻信號,有低功耗、高精度和高速度等優(yōu)點,其在數(shù)字媒體遠程監(jiān)控中能并行處理數(shù)字信號,以實現(xiàn)實時準確監(jiān)控;文獻[2]通過建立多個通信節(jié)點覆蓋待監(jiān)控區(qū)域,收集、轉換變電站監(jiān)控數(shù)據(jù)格式并分類異常,實現(xiàn)變電站運行狀態(tài)實時監(jiān)控與異常檢測。但數(shù)據(jù)中心UPS設備的遠程通信與監(jiān)控有其特殊性,對通信延遲和故障率要求高,所以這兩種方法難以滿足其實際需求。
云計算技術具有強大的數(shù)據(jù)處理和存儲能力[3],能夠實現(xiàn)大規(guī)模數(shù)據(jù)的實時分析和處理。將數(shù)據(jù)中心UPS設備的監(jiān)控數(shù)據(jù)上傳至云端,利用云計算技術進行數(shù)據(jù)分析和處理,可以實現(xiàn)對UPS設備的遠程監(jiān)控和故障預警,為數(shù)據(jù)中心的協(xié)同管理和運維提供便利。
選擇數(shù)據(jù)中心UPS遠程通信端口
在選擇數(shù)據(jù)中心UPS遠程通信端口的過程中,需遵循高效穩(wěn)定應對特定需求[4的原則。本文以 pmin 作為UPS遠程通信端口的最小編號,以 pmax 作為UPS遠程通信端口的最大編號。在編號序列中,最小編號與最大編號的差距越大,待選擇的UPS遠程通信端口數(shù)量就越多。數(shù)據(jù)中心UPS遠程通信端口的通信目標g可由下式計算得出:

式中, ξ 表示第i個遠程通信端口的動態(tài)調整因子。
在已確定通信目標的基礎上,建立連續(xù)的遠程通信中繼節(jié)點,從而增強數(shù)據(jù)中心的整體通信效能。在云計算架構下,當兩個遠程站點被指定后,數(shù)據(jù)中心
UPS遠程通信端口的選擇流程也逐步趨于完善,直至通信效率系數(shù)達到穩(wěn)定狀態(tài),方可執(zhí)行全面的通信管理指令[5]。結合公式(1),數(shù)據(jù)中心UPS遠程通信端口的選擇結果h可描述為

式中, bmin 表示最小通信效率系數(shù); bmax 表示最大通信效率系數(shù);
表示遠程站點的被指定位置。由此即可完成基于云計算的數(shù)據(jù)中心UPS遠程通信端口選擇。
2 構建數(shù)據(jù)中心UPS數(shù)據(jù)遠程通信監(jiān)控模型
在選定數(shù)據(jù)中心UPS遠程通信端口之后,本文利用云計算技術來構建數(shù)據(jù)中心UPS數(shù)據(jù)遠程通信監(jiān)控模型,以便深入分析遠程通信過程中異常端口的負載變動模式。首先,在遠程通信端口間建立雙向鏈路[,并設定遠程通信中待傳輸與同步的數(shù)據(jù)塊總數(shù)為 M 。借助云計算的強大數(shù)據(jù)處理能力,計算遠程通信鏈路中的負載變動特征:

式中, Δlj(t) 表示第 j 個數(shù)據(jù)塊隨時間的負載變化量; Δl(t) 表示時間t的平均負載變化量; wj 表示數(shù)據(jù)塊j的權重。
3 分級監(jiān)控數(shù)據(jù)中心UPS遠程通信異常
在成功構建了基于云計算技術的數(shù)據(jù)中心UPS遠程通信智能監(jiān)控模型后,本文采用了分級分層監(jiān)控方式,以實現(xiàn)對數(shù)據(jù)中心UPS遠程通信異常流量的全面監(jiān)控。此次監(jiān)控體系包含三個層級:異常特征識別、流量趨勢平滑分析以及通信模式比對。
首先,實時追蹤數(shù)據(jù)中心UPS遠程通信信道中的數(shù)據(jù)變化、流量波動以及信息傳輸狀態(tài),從中篩選出異常數(shù)據(jù)。隨后,將這些異常數(shù)據(jù)導入已建立的數(shù)據(jù)中心UPS遠程通信智能監(jiān)控模型中,進行精確的特征匹配。
在此基礎上,進一步采用流量趨勢平滑分析的方法。設 F(t) 表示負載變動特征為 L(t) 時的通信流量,S(t) 為經(jīng)過平滑處理后的流量值,可以使用指數(shù)平滑公式:
S(t)=αF(t)+(1+α)S(t-1)
式中, α 表示平滑系數(shù),取值范圍為 0lt;αlt;1 通過劃分不同的通信監(jiān)控區(qū)域,對數(shù)據(jù)中心UPS遠程通信信道在微觀短期內的異常進行細致監(jiān)控,從而捕捉到局部通信流量的異常現(xiàn)象。
最后,對在區(qū)域監(jiān)控中可能遺漏的信息數(shù)據(jù)進行深入分析。以宏觀長期監(jiān)控為主,將當前監(jiān)控到的異常信息數(shù)據(jù)與前一天相同時段內的數(shù)據(jù)進行對比。設Do(t) 和 Dy(t) 分別表示今天和昨天時間t時的異常數(shù)據(jù)量,使用相似度公式來衡量兩者之間的差異:

通過上述公式,可以判斷數(shù)據(jù)中心UPS遠程通信異常流量的變化情況,并實時上傳通信異常監(jiān)控結果,從而完成分級監(jiān)控數(shù)據(jù)中心UPS遠程通信異常流量的目標。在分級監(jiān)控過程中,必須始終注重保障終端用戶的通信需求,確保監(jiān)控過程不會對用戶的通信質量和體驗造成負面影響。
實驗測試分析
4.1實驗準備
上述設計的實驗平臺所必需的全部設備及其詳細技術參數(shù)已經(jīng)清晰地列在了表1中。
為了深入驗證基于云計算的數(shù)據(jù)中心UPS遠程通信與監(jiān)控方法的實用性,本文采用了某大型數(shù)據(jù)中心的實際運行數(shù)據(jù)作為研究素材,挑選連續(xù)兩天的UPS運行記錄,構成兩個基準數(shù)據(jù)集,如表2所示。

為了充分驗證本文提出的基于云計算的數(shù)據(jù)中心UPS遠程通信智能監(jiān)控方法的有效性,本次實驗采用對比驗證法,將其與文獻[1]中基于DSP的數(shù)字媒體遠程視頻通信監(jiān)控方法及文獻[2]中基于無線通信網(wǎng)絡的無人值守變電站遠程監(jiān)控方法進行對比分析。
4.2通信異常比例分析
計算UPS-FT01與UPS-FT02兩個數(shù)據(jù)集中UPS通信異常事件的占比,以獲取UPS遠程通信異常的比例,公式為

式中,Y和Y分別表示UPS-FT01與UPS-FT02數(shù)據(jù)集的UPS通信異常事件數(shù);Y表示總事件數(shù)。
若通信異常比例超過0.002,則將數(shù)據(jù)集標記為通信異常;反之,則標記為通信正常。三種方法的通信異常比例結果,如圖1所示。


根據(jù)圖1可以看出,在所有時間點,本文提出的方法所監(jiān)控到的通信異常比例均穩(wěn)定地超過了0.002的閾值,明確地將相關數(shù)據(jù)集標記為通信異常。相比之下,盡管文獻[1]提出的和文獻[2]在某些時間點也檢測到了通信異常,但其異常比例并未始終保持在0.002以上,表明在某些情況下會遺漏異常信號。綜上所述,本文提出的方法憑借其出色的性能和穩(wěn)定性,在檢測UPS遠程通信異常方面展現(xiàn)出了明顯的優(yōu)勢。
4.3監(jiān)控指令響應速度結果分析
在實驗時,關注到監(jiān)控指令的響應速度能直觀反映數(shù)據(jù)中心UPS的通信效率。實驗預期,隨著響應速度的逐步提升,數(shù)據(jù)中心UPS的通信效率將顯著增強,反之則表明存在優(yōu)化空間。三種方法的監(jiān)控指令響應速度的具體變化情況,如圖2所示。

根據(jù)圖2可以看出,本文提出的方法的響應速度明顯快于文獻[1]和文獻[2]提出的方法。具體而言,在數(shù)據(jù)總量為 8×1015 TB時,本文提出的方法的響應速度已降至1.1秒,相比之下,文獻[1]和文獻[2]提出的方法響應速度分別為2.8秒和2.5秒。結果表明,本文提出的方法在提升數(shù)據(jù)中心UPS通信效率方面具有顯著優(yōu)勢。更快的響應速度意味著能夠更迅速地處理監(jiān)控指令,從而更有效地監(jiān)測和管理UPS設備的運行狀態(tài),降低故障發(fā)生的概率,提高數(shù)據(jù)中心的穩(wěn)定性和可靠性。
5 結束語
本文探討了基于云計算的數(shù)據(jù)中心UPS遠程通信與監(jiān)控方法,以提升數(shù)據(jù)中心穩(wěn)定運行和高效管理能力,實現(xiàn)UPS設備實時監(jiān)測、故障預警與遠程控制。該方法提高了UPS設備可靠性、穩(wěn)定性,為數(shù)據(jù)中心智能化管理和運維提供新技術路徑。未來將深化研究、優(yōu)化性能,推動此方法廣泛應用,助力數(shù)據(jù)中心發(fā)展。
參考文獻
[1]溫雪.基于DSP的數(shù)字媒體遠程視頻通信監(jiān)控方法[J].長江信息通信,2023,36(4):152-154.
[2]鄭磊,王楠,陳俊,等.基于無線通信網(wǎng)絡的無人值守變電站遠程監(jiān)控方法[J].電氣技術與經(jīng)濟,2024,53(4):193-195.
[3]徐飛.基于UPS的數(shù)據(jù)中心機房配電系統(tǒng)及其優(yōu)化研究[J].光源與照明,2024,20(10):180-182.
[4]黃海.基于云計算的通信數(shù)據(jù)中心能耗優(yōu)化探究[J].大眾標準化,2024,15(9):168-170.
[5]王磊.UPS供電模式在大數(shù)據(jù)中心工程中的應用[J].建筑機械化,2024,45(5):136-139.
[6]張振雨.基于光纖通信的電力監(jiān)控數(shù)據(jù)安全傳輸方法[J].長江信息通信,2024,37(3):180-182.