貴州電網有限責任公司信息中心 甘潤東 王 策 龍 娜 方心科技股份有限公司 劉 斌 詹 柱
電力行業超算平臺,是為了滿足電力行業對大規模數據處理和高性能計算的需求而建立的計算平臺。隨著電力行業的快速發展和電力系統的復雜性增加,超算平臺在電力行業中的應用越來越廣泛,可以用于電力系統的優化調度、能源預測、風電和光伏發電等新能源的集成,以及電力設備的仿真和模擬等任務[1-2]。
由于超算平臺涉及大量的敏感數據和關鍵任務,軟件安全和可控性成為亟待解決的問題[3-4]。面向電力行業超算平臺的自主可控基礎軟件研究具有重要的意義和價值,具體包括以下幾個方面。
一是提高系統安全性。電力行業超算平臺處理是涉及國家能源安全和電力供應的重要任務,因此軟件安全性是至關重要的。研究電力行業自主可控基礎軟件可提供安全可靠的軟件解決方案,保護敏感數據和關鍵任務的安全。
二是實現數據保護和隱私保密。電力行業超算平臺涉及大量的電力系統數據和用戶隱私信息。通過電力行業自主可控基礎軟件的研究,可以確保數據的保護和隱私的保密,防止數據泄露和濫用。
三是提升系統可控性。電力行業超算平臺需要對任務進行調度和資源進行管理,以實現高效地計算和優化。自主可控基礎軟件的研究可以提供靈活、可定制和可控的任務調度和資源管理機制,滿足不同應用場景的需求。
四是推動電力行業發展。電力行業超算平臺的發展對于電力系統的優化和智能化具有重要的推動作用。通過研究自主可控基礎軟件,可以提高超算平臺的性能和可靠性,促進電力行業的創新和發展。
電力行業超算平臺的基礎軟件主要包括以下幾個方面的組件和工具,如圖1所示。

圖1 電力行業超算平臺基礎軟件組成
一是操作系統。超算平臺通常采用高性能計算領域常用的操作系統,如Linux 操作系統具有開源、穩定、可擴展等特點,適用于大規模計算和數據處理。
二是虛擬化技術。虛擬化技術可以將物理資源劃分為多個虛擬資源,提高資源利用率和靈活性。在超算平臺中,虛擬化技術可以用于資源隔離、任務調度和性能管理等方面。
三是分布式文件系統。超算平臺需要處理大規模的數據,因此需要采用分布式文件系統來管理和存儲數據。常用的分布式文件系統包括Hadoop Distributed File System(HDFS)和Parallel File System(PFS)等。
四是調度器和資源管理器。超算平臺需要高效地管理任務調度和資源分配,以實現任務的優化和資源的最大利用。調度器和資源管理器可根據任務的需求和系統的狀態進行智能調度和資源分配。
五是并行編程框架。超算平臺需要支持并行計算和分布式計算,因此需要采用并行編程框架來開發和優化并行算法。常用的并行編程框架包括MPI(Message Passing Interface)和OpenMP 等。
六是數據庫管理系統。超算平臺可能需要存儲和管理大規模的數據集,因此需要采用高性能的數據庫管理系統來支持數據的存儲和查詢。
七是網絡通信庫。超算平臺需要進行大規模的數據通信和消息傳遞,因此需要采用高性能的網絡通信庫來實現快速和可靠的數據傳輸。
八是監控和調試工具。超算平臺需要具備強大的監控和調試工具,用于實時監測系統的狀態和性能,并進行故障診斷和性能優化。
電力行業超算平臺的基礎軟件組件和工具共同構成了超算平臺的基礎架構,支持高性能計算和數據處理的需求,具體的軟件選擇和配置會根據超算平臺的具體需求和部署環境進行調整和優化[5]。
電力行業超算平臺基礎軟件面臨的挑戰分為安全性和自主可控兩個方面。其中,電力行業超算平臺基礎軟件面臨的安全性挑戰主要包括以下幾點。
一是數據和隱私保護。電力行業超算平臺處理的是大量敏感數據,包括電力系統數據和用戶隱私信息。確保數據的保護和隱私的保密是一個重要的挑戰,需要采用加密、訪問控制、數據脫敏等技術手段來防止數據泄露和濫用。
二是網絡安全。超算平臺需要與外部系統進行通信和數據交換,因此面臨來自網絡攻擊、惡意軟件和惡意用戶的安全威脅。需要采取防火墻、入侵檢測和防御、安全認證等措施來保護超算平臺的網絡安全。
三是軟件漏洞和攻擊。超算平臺的軟件可能存在漏洞和弱點,可能會被黑客利用進行攻擊和入侵。需要進行全面的軟件安全審計和漏洞修復,以減少潛在的安全風險。
四是社會工程學攻擊。社會工程學攻擊是指通過欺騙、誘導等手段獲取系統訪問權限或敏感信息的攻擊方式。超算平臺需要加強用戶教育和安全意識培訓,以防止社會工程學攻擊的發生。
電力行業超算平臺基礎軟件面臨的自主可控挑戰主要包括:一是技術自主可控。電力行業超算平臺軟件的開發和運行涉及多個關鍵技術,如操作系統、數據庫管理系統、網絡通信協議等。確保這些關鍵技術的自主可控性是一個重要挑戰。在設計和選擇超算平臺軟件時,需要考慮使用自主開發的技術或者具有自主知識產權的技術,以減少對外部技術的依賴。
二是數據自主可控。電力行業超算平臺涉及大量的敏感數據,包括電力系統數據和用戶隱私信息。保護這些數據的自主可控性是一個關鍵挑戰,需要采取數據加密、數據隱私保護和數據本地化等措施,確保數據在存儲和傳輸過程中不被竊取、篡改或濫用。
三是安全自主可控。超算平臺的安全性對于電力行業至關重要。確保超算平臺的安全自主可控性是一個重要挑戰。這包括自主開發和使用安全防護技術、自主設計和實施安全策略、自主進行安全評估和漏洞修復等。通過提高自主安全能力,可以降低對外部安全產品和服務的依賴,減少潛在的安全風險。
四是管理自主可控。超算平臺的管理涉及任務調度和資源管理、用戶權限管理、系統監控和審計等方面。確保超算平臺管理的自主可控性是一個挑戰。需要建立自主的管理機制和流程,確保對超算平臺的管理具有靈活性和可控性,能夠根據實際需求進行調整和優化。
五是可擴展性自主可控。超算平臺需要具備良好的可擴展性,能夠根據需求進行資源擴展和系統升級。確保超算平臺的可擴展性自主可控性是一個挑戰。需要在設計和架構上考慮自主擴展的能力,避免對外部廠商的依賴,以便更好地滿足電力行業的需求。
當前形勢下,電力行業超算平臺基礎軟件面臨以下幾個發展機遇。
處理器和硬件技術的進步:新一代的處理器和硬件技術(如GPU、FPGA)的不斷發展,提供了更高的計算能力和能效比,為超算平臺基礎軟件的性能提升提供了機遇。新的算法和優化技術:隨著超算領域的研究和發展,新的算法和優化技術的出現,可以進一步提高超算平臺基礎軟件的計算效率和數據處理能力。
開源軟件和工具的發展:開源社區為超算平臺基礎軟件提供了豐富的資源和支持。通過參與開源社區,電力行業可以與全球開發者合作,共同推動超算平臺基礎軟件的發展??珙I域合作:超算平臺基礎軟件的發展需要跨領域的合作,與學術界、工業界和其他行業的合作可以促進技術交流和創新,提高超算平臺基礎軟件的質量和功能。
彈性資源和按需服務:云計算平臺可以提供彈性資源和按需服務,為電力行業超算平臺提供更靈活的計算和數據處理能力。這可以降低電力行業的IT 成本,提高資源利用效率。大數據分析和智能優化:大數據技術可以幫助電力行業更好地管理和分析海量的電力系統數據,通過應用機器學習和人工智能算法,實現電力系統的智能優化和故障檢測,提高電力系統的可靠性和效率。
安全性增強:隨著電力行業的數字化轉型,超算平臺基礎軟件需要加強安全性,保護電力系統的數據和網絡免受惡意攻擊和數據泄露的威脅。安全技術和解決方案的發展為電力行業提供了保障。可靠性提升:超算平臺基礎軟件需要具備高可靠性,能夠保證電力系統的持續運行和數據的完整性。新的技術和算法的應用可以提高超算平臺基礎軟件的容錯性和可靠性。
政策支持:國家將超算技術和應用視為國家戰略的一部分,提供政策和資金支持。這為電力行業超算平臺基礎軟件的發展提供了機遇。通過積極參與國家級項目和合作,電力行業可以獲得更多的資源和支持。資金投入:政府和企業對超算平臺基礎軟件的研發和應用投入資金,為電力行業提供了發展機遇。這些資金可以用于推動技術創新、人才培養和基礎設施建設,促進超算平臺基礎軟件的發展。
電力行業超算平臺基礎軟件的未來展望主要包括以下幾個方面。一是自主研發和創新:為了實現自主可控,電力行業應當加大對超算平臺基礎軟件的自主研發和創新力度。通過培養本土的技術人才和團隊,電力行業可以自主設計和開發符合自身需求的超算平臺基礎軟件,減少對外部技術的依賴。
二是安全和隱私保護:自主可控要求電力行業能夠保護超算平臺基礎軟件的安全和隱私。電力行業應當加強軟件的安全設計和開發,采用安全加密算法和技術,確保超算平臺基礎軟件的數據傳輸和存儲過程中的安全性。同時,電力行業需要制定隱私保護政策和措施,保護用戶的個人信息和敏感數據。
三是國產化替代:為了實現自主可控,電力行業應當鼓勵和支持本土的超算平臺基礎軟件開發和供應商。通過引入國產化替代方案,電力行業可以減少對外部軟件的依賴,提高自主控制能力。政府可以出臺相關政策和措施,支持本土企業在超算平臺基礎軟件領域的發展和創新。
四是開源合作與共享:開源軟件和開源社區提供了一種自主可控的方式。電力行業應當積極參與開源社區,與全球開發者合作,共同推動超算平臺基礎軟件的發展。通過開源合作和共享,電力行業可以獲取開源軟件的源代碼,進行自主修改和定制,滿足自身的需求。
五是安全審計和評估:為了確保超算平臺基礎軟件的安全性和可控性,電力行業應當進行安全審計和評估。通過對超算平臺基礎軟件進行全面的安全性評估和漏洞掃描,及時發現和修復潛在的安全風險,提高軟件的自主可控能力。