張弘強,張軍,肖建紅,袁楷奕,田海平
(1.國網湖南省電力有限公司電力科學研究院,湖南 長沙 410208; 2.高效清潔發電技術湖南省重點實驗室,湖南 長沙 410208; 3.國網湖南省電力有限公司供電服務中心(計量中心),湖南 長沙 410004; 4.中南大學計算機學院,湖南 長沙 410083)
水電是清潔能源,在國家節能減排戰略和能源結構轉型中扮演著重要地位,是實現碳達峰、碳中和目標的主要手段之一[1]。在保障生態基流的前提下,充分發揮小流域水電站發電潛能,對改善邊遠地區用電狀況、促進農村經濟發展、建設全面小康社會具有重要作用[2]。
但是,小水電主要分布在集水面積較小的流域上,此類流域通常屬于無資料或少資料流域,其內部氣象和水文站點稀疏,難以獲取流域內詳細準確的降水、蒸發、徑流等氣象水文數據[3],且小電站管理無序、滯后,監測數據質量參差不齊,小水電的發電能力預測困難[4]。現階段,小流域只能根據經驗調度圖或實時來水信息進行調度,導致小水電實際發電量隨來水波動較大,汛期通常存在棄水,枯水期則難以保障河道生態流量,不利于電網電壓的均衡穩定。此外,絕大多數小水電缺少高精度的氣象水文數據測報系統[5],水情數據難以及時向小水電傳遞。
因此,本文研究并提出小流域高精度氣象水情測報系統,通過對多源異構的降水、蒸發、徑流等氣象水情數據進行數據清洗和融合計算,構建高精度的小流域基礎數據庫;并進一步對基于深度學習的地面與遙感氣象數據融合模型、基于遙感的流域水情監測模型進行信息封裝與集成。通過在湖南省渫水流域進行數據質量測試和適應性實驗,充分驗證了小流域高精度氣象水情系統的有效性,為小水電水文預報[6-7]、水電群優化運行調度[8-9]等工作提供可靠的科學數據與信息平臺支撐。
小流域高精度氣象水情測報系統從下至上共有5層,分別為數據采集層、數據處理層、業務邏輯層、API接口層與前端顯示層。系統架構如圖1所示。

圖1 小流域高精度氣象水情測報系統框架
數據采集層包含了為業務應用提供支撐的操作系統、中間件和數據庫(Docker容器、Redis、MySQL數據庫)[10]等。所采集數據涵蓋湖南省內120個氣象站點的統計數據,以及電力部門供電、并網需求、電站的庫容-水位關系曲線、特征水位、下泄能力、發電流量等小水電基本信息。
數據處理層負責對數據采集層的數據進行數據清洗、數據存儲和編碼轉換處理。其中數據清洗包括數據過濾與篩選,通過剔除冗余數據,減少數據規模,提高系統效率,節省存儲空間[11-12];數據存儲指將清洗后的數據存儲到MySQL數據庫中,便于業務邏輯處理層讀取;編碼轉換處理包括對數據由JSON格式轉換成字符串,再統一采用UTF-8編碼存儲。
業務邏輯層包含了深度神經網絡數據融合模型結果展示、流域信息匯總、水電接口獲取、歷史數據處理等。業務邏輯層是對小流域高精度氣象水情測報系統的基礎數據庫與深度神經網絡數據融合模型進行集成處理。
API接口層包含了水電站信息接口、氣象接口、云端接口等。API接口層主要包括國家電網有限公司(以下簡稱“國網”)水電站和氣象信息的API數據接口和系統部署在云端的API操作接口。借助API接口層,整個系統實現了前后端分離,各層之間解耦,各層借助API接口實現互相調用。
前端顯示層包含了流域地圖展示、水電站地形信息展示、電站基本情況展示、氣象水文站點數據展示、流域基本信息數據展示、高精度氣象水情測報結果展示等。
基礎數據包括靜態數據和動態數據,其中靜態數據主要指水電站的各項基本參數,包括機組數量、裝機、單機最大引水流量、死水位和流域地形等。動態數據主要是流域內氣象站的降水量、發電廠的水位數據、發電廠的發電量、發電廠的每月目標水位,以及模型預測的小時降水量和日蒸發量等數據。然后,以小水電展示數據需求的數據獲取頻度、業務規則、數據類型、數據存量、數據增量等信息為輸入,完成靜態與動態數據的系統接入。
一方面,為制作無資料流域的高精度氣象數據集,需通過地面雨量站點數據對降水、蒸發等網格數據進行校正[13-14]。另一方面,基于出力發電轉換關系、水位變化關系、電站基礎檔案等信息,制定小流域水電數據應用數據清洗、轉換規則,清洗無效數據,形成有效數據集。
數據清洗規則包括出力全天為空、出力超裝機容量、有出力無發電量、有發電量無出力、壩上水位低于壩下水位、水位超限制水位等6項規則。同時,針對小流域的氣象站點實測蒸發、降水數據進行收集制表,并使用網格點標記。圖2展示了湖南省渫水流域及模型校正點(實測站點)位置。

圖2 渫水流域水系及矯正點圖
清洗后的數據隨后進行格式轉換,調整為符合測報模型要求和統計需要的數據格式。數據清洗與讀取配置文件采用微軟的POI組件寫入Excel文件,其中,Workbook代表著一個Excel文件,Sheet代表著Workbook中的一個表格,Row代表Sheet中的一行,而Cell代表著一個單元格。HSSFWorkbook對應.xls文件,兼容Office 1997—2003版本。XSSFWorkbook對應.xlsx文件,兼容Office 2007以上版本。
系統中Excel文件的讀取采用開源組件easyexcel[15]。因為其他Java解析、生成Excel的主流框架(如Apache POI和jxl)都存在十分耗內存的問題。而easyexcel解析所需內存較少,且不會出現內存溢出等問題。數據解析流程如圖3所示。

圖3 數據解析流程
根據數據來源分別通過系統接口、工具配置、服務調用、協同計算、文件傳遞等方法從內部數據層級、外部各應用系統獲取所需數據,并按照流域小水電數據應用的業務規則對獲取數據進行融合處理。數據整理流程如圖4所示。
1)數據接入與分析。首先將氣象水情和發電數據等存入數據庫;隨后通過設置數據接口,對接系統內部數據云上更新的流域地形、水電站出入水量等水電站基礎信息,通過數據分類、地區統計、數據分析等整理出各地區電站高精度氣象數據、小水電實時調度出力數據等;最后基于特征提取,構建異常數據表,并對冗余和缺失數據進行清洗和過濾,由此構建清洗后的小流域基礎數據庫。
2)模型集成與數據預測。通過集成深度神經網絡融合模型[16],對接模型的輸入輸出數據;通過模型計算和數據處理,得到各電站蒸發量、降水量的預測數據及誤差參數,經由數據接口傳輸到前端界面。

圖4 數據整理流程
如圖5所示,界面集成是指通過頁面嵌入或鏈接引用、單點登錄等方式,實現與GIS地圖、電網統一視頻、小流域高精度水文數據庫系統、用戶操作與權限后臺管理系統和水庫調度系統的高度有機結合。

圖5 集成架構
服務集成是指將統一權限、賬號、組織、角色、信息系統菜單、信息系統功能、用戶權限、角色權限等數據服務統一集成,將國網省公司本部及電科院、市縣公司和各水電站等部門劃分為匿名資源、公共資源、權限資源,實現未來業務應用之間功能交互或流程貫通。
數據集成是指把湖南省小流域的電站基礎數據、水庫運行數據、高精度氣象水情數據及徑流數據清洗后進行集成和融合。
為了定量評估所構建的氣象水情測報系統和深度神經網絡融合模型的性能,采用10折交叉[17]將流域雨量站數據分為訓練集和測試集。使用10個訓練模型的平均值來評估每個雨量計的性能。在整個研究區域上,所有測試雨量站的均值作為評估結果。在數據融合的基礎上,選擇平均絕對偏差(PMAE)、均方根誤差(PRMSE)、決定系數(R2)[18]評估融合數據的精度,各指標計算公式如式(1)—(3)所示。
(1)
(2)
(3)

試驗中,分別提取覆蓋湖南省渫水流域范圍的遙感降水和蒸發網格點,如圖6、圖7所示,渫水流域范圍內包括了50個降水網格點、12個蒸發網格點,分辨率分別為0.1°和0.25°(經緯度)。

圖6 渫水流域遙感降水網格點范圍

圖7 渫水流域遙感蒸發網格點范圍
構建渫水流域范圍內衛星和氣象站融合模型,將得到的模型用于整個區域上,即將每一個格點的子網格數據輸入融合模型,得到每個格點位置的降水數據,由此得到整個研究區域上的融合降水場,并使用實測降水和實測蒸發數據對該模型進行訓練,得到融合結果。同時,所有模型結果都使用10折交叉驗證來進行檢驗。表1為深度神經網絡融合模型在2017—2020年8個氣象站上降水、蒸發數據的融合精度分析結果。如表1所示,本系統使用的深度神經網絡融合模型在小時降水和日蒸發數據預測的平均絕對誤差分別為1.12%和0.43%,均方誤差為1.13%和0.01%,均方根誤差為1.16%和0.56%,相關系數為0.989和0.988。圖8和圖9為氣象站點位降水和蒸發過程模擬值與實測值的對比。試驗結果表明,深度神經網絡融合模型能有效、準確地預測小時降雨與日蒸發數值。

表1 2017—2020年氣象站上數據融合結果

圖8 氣象站點位降水過程模擬值與實測值對比

圖9 氣象站點位的蒸發過程模擬值與實測值對比
為提高水情監測的精準度,彌補小水電流域水情監測的缺失,本文首先構建小流域高精度數據庫,通過自動化數據清洗和轉換方法,集成小流域動態與靜態的多源異構數據;同時針對地處偏遠、氣象資料缺乏的小流域,結合遙感監測技術和深度學習融合模型,在小流域建立具有高時空精度的氣象監測系統,補充小流域氣象數據,為后期的氣象預報和降雨徑流等相關模型研發工作提供數據支撐[19-20],并有效協助電力部門完善流域數字化信息平臺建設。