駱科東*
(中國石油天然氣股份有限公司規劃總院)
理念是行動的先導。自從習近平總書記在黨的十八屆五中全會首次提出創新、協調、綠色、開放、共享的發展理念以來,綠色低碳發展作為新發展理念的重要組成部分,在全社會得到廣泛全面踐行,并在實踐中不斷豐富完善對其的認知和實施能力。黨的十九屆五中全會進一步提出“促進經濟社會發展全面綠色轉型”,綠色低碳發展還將深入貫徹到“十四五”和今后更長時期發展過程中去。
2020 年9 月22 日,習近平總書記在聯合國大會上鄭重宣布:“中國將提高國家自主貢獻力度,采取更加有力的政策和措施,二氧化碳排放力爭2030年前達到峰值,努力爭取2060 年前實現碳中和。”在這一要求下,信息化工作也需要在支持數字經濟健康發展和推動各行業數字化成功轉型的同時,更加努力實現自身的綠色低碳發展,為“碳達峰”“碳中和”貢獻一份自己的力量。
近年來,隨著國家數字經濟的發展和各行業數字化轉型的大力推進,信息化建設應用越來越普及,但同時能源消耗和碳排放也越來越多。而且,隨著數字經濟的加速發展和數字化轉型的深入,信息化建設應用步伐還會進一步加快。因此,研究信息化本身的綠色低碳發展問題,采用恰當的策略輔助信息化工作實現綠色低碳發展,成為當務之急。
伴隨著互聯網經濟的迅猛發展,消費領域信息化建設帶動了社會信息化發展,當工業互聯網、數字化轉型、智能工廠等理念逐漸深入人心,生產領域各行業的企業信息化建設也隨之興起,引起更大規模的建設浪潮,如管道工程數字化移交[1]、“互聯網+”城市燃氣銷售[2]、油田企業數字化建設[3]等。從信息化建設的載體—數據中心(Data Center)的發展來看,截止2018 年中國超大型、大型和中小型數據中心在用機總架數達到226×104架,規劃在用機架數達到181×104架,且2017、2018 的年度增長率分別為34%和36%,呈現高速增長態勢[4]。特別是隨著5G、邊緣計算等新技術發展,作為感知連接、就地計算、云邊協同、云端互動載體的各類型運算節點,會更加快速地增加。
加速增長的數據中心、運算節點必然帶來巨大的能耗需求。據綠色和平組織和華北電力大學報告顯示,2018 年中國數據中心用電總量為1 608×108kW·h,占全社會用電總量的2.35%,耗電對應總碳排放達到9 855×104t,占中國碳排放總量約1%(中國2018 年碳排放總量為95×108t)[5],預計2023年總用電量還將增加65.82%,耗電對應總碳排放預計達到1.63×108t[6](發電結構不變情況下)。以上只考慮了成規模的數據中心,如果疊加海量存在的設備間、基站、智能設備等分散式小規模運算節點,信息化的總能耗及碳排放問題會更加凸顯。
按照黨中央提出的“十四五”及今后一段時期經濟社會發展目標要求,許多地方已經將數字經濟作為未來發展的重點。在國務院國資委的大力推動下,各行業的龍頭企業紛紛帶頭加入數字化轉型的浪潮之中。數字經濟、數字化轉型的蓬勃發展將政府、社會、企業的信息化帶入了一個全新的階段。信息化建設及應用的總量勢必成倍增加,其在全國能耗總量、碳排放總量中的比例也會大幅上升。在這種形勢之下,深入分析信息技術和信息化工作的特點,制定有針對性的策略,降低信息化建設應用的單位能耗,以更高的效率和相對更低的能耗排放來提供信息化產品與服務,助力數字經濟和數字化轉型工作,就顯得非常重要了。
信息化綠色低碳發展最終效果體現在算力的能耗上。算力主要是指在數據中心,也包含小規模機房、設備間乃至于智能設備上的計算能力。但是要減少能耗,不能只考慮算力本身,還要考慮數據和應用兩個方面,后兩者的理順、優化可以促進高效計算、避免無效計算,從源頭減少能耗。數據方面與能耗排放主要相關的是各種業務數據,而不是系統配置、技術管理相關的數據。應用方面與能耗排放主要相關的是各種算法,當然也包括所采用的軟件架構。
不管是算力、數據還是應用,主要的降低能耗和排放措施都可以從領域內主體技術的改進和相關資源的共享方面著手,并結合一定的指標約束管理機制,達到有效利用信息化資源的目的(見表1)。

表1 信息化綠色低碳策略表
下文的分析主要站在信息化建設主體的角度,即指信息化建設的組織實體,包括但不限于政府、企業、行業組織、社會團體等。當然從全社會信息化的工作量比例來說,還是以政府和企業為主,在策略考慮上也主要針對這兩類建設主體。
另外,本文所提到的策略只是從信息化工作本身著眼,而信息化建設應用的能源消耗和碳排放更是與全社會的綠色低碳發展息息相關。如果社會發展結構實現了清潔能源、可再生能源轉型,在相同的信息化建設模式下其碳排放也會大大減小。再比如,相當多的大型數據中心采用了燃氣發電機組冷熱電三聯供技術,這樣燃氣發電技術本身的改進也將會直接影響數據中心能耗。由于這些都是通用的技術和方法,不限于信息化領域,也就不在本文的探討范圍之內了。
首先是應用先進的數據中心用能節能技術。數據中心在節能減排方面的主要措施是降低 PUE(Power Usage Effectiveness)值,可以采取三種方式:一是建設選址到氣溫相對較低的地區,降低最主要的空調能耗;二是結合精細化溫度監控、動態環境監測,通過精準降溫減少能源開銷,通過高效的冷卻技術降低額外能耗[7];三是考慮能源技術本身,選址宜選擇可再生能源資源豐富的地區,規模較大者可直接部署冷熱電三聯供提高能效水平。
其次是算力方面的資源共享。在建設主體內部,已經廣泛采用集中式的數據中心實現算力相關的技術資源共享,這方面已經相對集約化。但隨著數字經濟的發展,不管是政府、企業還是社會組織,相當多的信息化需求需要借助于外部算力資源,比如地理信息、身份識別、智能預訓練模型等等,這就需要將建設主體的自有算力與外部算力有機結合,形成混合云的協作方式實現高效的算力資源利用。
隨著物聯網(Internet of Things)的廣泛應用和邊緣計算(Edge Computing)的發展,除了考慮大量現場數據采集、業務處理的建設主體,還需要考慮云邊協同的算力利用問題,將數據、算法在云、邊、端合理分布,合理設置分發本地計算所需參數,從而在實現有效的信息采集、知識獲取和業務響應基礎上,降低整體數據通信和計算需求。如,利用智能攝像頭或視頻流處理算法在邊端對監控視頻進行處理,只將異常、報警相關的視頻片段上傳云平臺。
算力方面的指標約束上,首先是數據中心PUE(Power Usage Effectiveness)值。這些年國家努力促進數據中心的低PUE 值設計,推廣綠色數據中心先進實用技術,設定綠色數據中心標準并開展評比,明確要求新建數據中心PUE 值要低于1.5。其次是CPU、存儲等主要算力資源的利用效率,并通過對資源利用情況的監控,及時釋放無效占用資源、縮減低效使用資源。還有邊緣計算數據上傳比,通過指標約束促進大量價值密度低的數據在本地處理。
數據方面的策略最基礎的還是數據治理(Data Governance)。建設主體通過數據治理建立起組織內部的元數據、主數據、數據標準、數據質量、數據集成、數據資產、數據安全等一整套模型、工具以及機制,以實現對數據的全面高效管理[8]。通過良好的數據治理,可以減少數據冗余,避免重復采集,實現精準使用,加強挖掘利用,同時也降低了數據采集存儲使用過程中的能源開銷。
數據方面需要重點關注的是多媒體、參數模型、運行日志等大體量數據。相當多的建設主體,其涉及數據的資源開銷也符合二八原則,往往大多數計算資源和絕大多數存儲資源都被少量大體量數據占用,而相當多的大體量數據利用效率較低,無效低效計算開銷廣泛存在??梢愿鶕篌w量數據的技術及應用特點采取針對性措施,比如劃分數據“冷熱”度,對于“冷”數據采用離線、半在線存儲方式,大幅度減少數據維持開銷;對于“熱”數據,加強緩存、預處理等手段,提高數據利用處理效率。還可以通過數據索引、特征提取等技術,實現預處理、局部精準提取等便捷計算方式。
數據資源的共享對節能降耗也十分重要。當前大型組織內部數據共享的主流手段是數據湖(Data Lake),也就是綜合利用數據存儲技術,集中式存放不同規模、不同原生格式的各類型數據,并支持對不同類型數據洞察分析,幫助用戶做出科學決策[9]。內部數據的集中存儲將顯著提高數據查找、分析、重復利用能力,從而降低能耗開銷。外部數據共享也很重要,建設主體要改變一切數據自行擁有的舊有觀念,在數字經濟時代,數據安全和隱私保護的發展,會進一步促進建設主體之間的數據共享利用。目前已經有不少行業都在采用數據湖技術加強內外部的數據共享能力建設[10]。
數據方面的約束指標設置上,首先是數據治理覆蓋度,也就是已經完成數據治理的數據域占數據域總量的比例。其次是大容量數據利用效率,可以用一段時間內大容量數據利用總量除以在線大容量數據存儲量來表示。另外,還可以有數據標準化、主數據等方面的指標。
應用方面最主要的策略就是平臺化方向。不管是微服務(Microservice)設計還是業務中臺、數據中臺概念,都是平臺化的方向,總的來說就是整體架構組織內部信息化所需要的各類技術資源,取消單個系統建設運維的煙囪式模式,代之以統一平臺、成熟資源、快速開發、APP 應用的模式,可以大幅度減少應用的建設周期、工作量以及基礎軟硬件方面的投入,從而降低能耗開銷。
平臺化需要注意兩個問題。一是平臺本身也有相當的性能開銷,因此只有具備相當規模的應用、應用間可共享大量技術資源,平臺化帶來的效率提升超過自身性能開銷,才具備實施的基礎。二是要注重共享技術資源的長期治理,及時清理過時、低效、甚至是失效的服務及應用,保證平臺整體的健康高效運行。
應用方面策略的關注重點是算法的效率,尤其是在智能化發展的今天,雖然人工智能、機器學習算法能帶來很大的業務效率提升,但自身的計算開銷也是相當巨大的,有些深度學習模型達到億級的參數規模,單次訓練就消耗大量電能。所以根據需要選擇所應用算法的技術路線,不是越準越好,也不是越快越好,而是適應業務要求,不要過分拔高;同時不斷根據應用情況開展算法優化,努力實現高效率低能耗的算法應用。
應用方面也存在外部資源利用問題。比如圖像識別、自然語言處理等通用任務??梢灾苯永猛ㄓ媚P蜕踔潦窃诰€服務,如果自身業務存在一些特點需要進行特定性模型優化,也可以引入預訓練模型進行改造,或者在通用算法結果上二次優化。未來隨著全社會數字化、智能化工作的進一步擴展深化,從單一的模型應用走向群體智能、跨媒體智能、人機混合智能、自主智能等新方向[11],也會演化出更多的算法服務模式,有利于各建設主體更加多、快、好、省地利用算法,節約能源。
應用方面的約束指標設置上,首先是平臺化的表征指標,從目前主流技術來說主要是微服務化率,也就是已經實現微服務化的應用占比。其次是通過總線實現應用間流程、數據接口的比例,微服務化率和總線化率的提升,可以有效提高應用之間的共享協同能力,并降低單個應用的開發周期,保證技術標準的一致性,減少基礎技術的重復投入,實現技術能力的共享利用。當然算法效率也是很重要的考慮因素,但由于各類型應用在算法上的差異性,需要根據業務需要、應用特點合理設置算法效率的約束指標。
當前中國的信息化工作所需要的能耗已經達到全社會能耗總量的相當比例,并將隨著數字化轉型、智能化發展,進一步增大能源消耗和相應的碳排放。在這種形勢下,采用綠色低碳方式發展信息化顯得尤為重要。在一個建設單位內部,實施綠色低碳的信息化策略可以從算力、數據、應用三方面入手,在技術改進、資源共享和約束指標設置等方面落實具體措施。
不管是政府還是企業的信息化工作,目前仍處于從分散建設到集中建設、集成共享的階段,關注點還沒有更多放到節能減排上來。未來隨著集中集成的全面實現、自動化智能化的廣泛應用,能耗占比越來越大,對節能減排的思考會更主動更深入,對綠色低碳的策略研究會更廣泛更實際。
當然,綠色低碳策略應用需要因地制宜,本文只是介紹了相對通用的方法和指標,建設單位在應用的時候,還需要結合自身特點,選擇具體的適用方法、指標,或者定制更有業務針對性的方法、指標,總的目的就是減少能耗和降低碳排放。同時,綠色低碳策略還需要與系統的安全性、方便性等結合起來統籌考慮,在滿足業務需求的前提下,將各種策略措施有機融入信息化的建設、運行、應用等各個環節,才能真正體現出綠色低碳發展的作用。