邱 超,何 錫 君,張 蘭
(1.浙江省水文管理中心,浙江 杭州 310027; 2.浙江省環(huán)境監(jiān)測(cè)中心,浙江 杭州 310012)
水文要素種類(lèi)繁多,包括雨量、水位、蒸發(fā)、流量、泥沙、水質(zhì)、墑情和水溫等反映水文情勢(shì)的各類(lèi)數(shù)據(jù),一般由水文站網(wǎng)通過(guò)水文測(cè)驗(yàn)獲取[1-2]。目前,浙江省水文部門(mén)已建成各類(lèi)水文要素監(jiān)測(cè)站點(diǎn)7 000多個(gè),共享氣象和城管等部門(mén)雨量監(jiān)測(cè)站4 000多個(gè),全省站網(wǎng)密度達(dá)到9 km2/站。水文數(shù)據(jù)已逐漸呈現(xiàn)出多源、多維、大量和多態(tài)的大數(shù)據(jù)特征[3]。水文部門(mén)利用多源匯集的大量數(shù)據(jù),歷年來(lái)為水利部門(mén)在防汛抗旱、水資源管理、水利工程建設(shè)、水生態(tài)修復(fù)等方面提供了全方位的服務(wù)。隨著機(jī)構(gòu)改革和大數(shù)據(jù)時(shí)代的來(lái)臨,應(yīng)急管理、自然資源、生態(tài)環(huán)境、氣象等其他政府部門(mén)以及社會(huì)公眾對(duì)水文部門(mén)的服務(wù)需求日益增長(zhǎng),充分利用人工智能、云計(jì)算等核心技術(shù)對(duì)海量數(shù)據(jù)進(jìn)行管理、交換、共享、分析和應(yīng)用成為當(dāng)前的重要任務(wù)。而為各類(lèi)型水文測(cè)站設(shè)計(jì)規(guī)律性代碼是標(biāo)志、識(shí)別和融合應(yīng)用多源數(shù)據(jù)以及建設(shè)水文大數(shù)據(jù)平臺(tái)的前提和支撐[4-5]。
隨著浙江省數(shù)字化改革的推進(jìn),數(shù)據(jù)歸集逐步多源整合,各部門(mén)無(wú)序編碼現(xiàn)象突出,氣象站、水情站、資料站等編碼各成體系,無(wú)法統(tǒng)一融合,阻礙了水文要素集成管理與綜合分析,導(dǎo)致數(shù)據(jù)使用效率低下[6]。現(xiàn)有水文測(cè)站編碼體系已經(jīng)不能滿(mǎn)足當(dāng)前跨行業(yè)跨部門(mén)站點(diǎn)的管理與應(yīng)用需求,逐步暴露出一些應(yīng)用問(wèn)題:① 編碼攜帶的信息量較少、可兼容性和可拓展性不足。現(xiàn)有編碼僅包含流域水系、測(cè)站類(lèi)型信息,缺少測(cè)站精確的空間位置信息,必須輔以其他信息才能準(zhǔn)確定位,同時(shí)編碼無(wú)法兼容氣象、城管等部門(mén)的站點(diǎn)信息,無(wú)法實(shí)現(xiàn)以地理空間網(wǎng)格為對(duì)象的多監(jiān)測(cè)要素信息融合,制約了水文信息網(wǎng)格分布式應(yīng)用。② 編碼管理水平不高。近年來(lái)隨著浙江省水文測(cè)站數(shù)量的迅速增加,目前的人工編碼方式已經(jīng)越來(lái)越不適合時(shí)代發(fā)展的要求:一方面人工編碼工作效率低;另一方面一站多碼、同站不同碼等錯(cuò)誤情況時(shí)有發(fā)生,直接影響了水文數(shù)據(jù)的信息化進(jìn)程。以GIS空間數(shù)據(jù)為技術(shù)框架,通過(guò)統(tǒng)一的數(shù)據(jù)模型和對(duì)象編碼,構(gòu)建物理集中與邏輯映射相結(jié)合的數(shù)據(jù)庫(kù)群是一種有效解決方案[7],將地理空間區(qū)域劃分成地理網(wǎng)格對(duì)象,基于網(wǎng)格對(duì)象的時(shí)間序列來(lái)實(shí)現(xiàn)任意空間和時(shí)間序列的水文分析計(jì)算,為后期無(wú)資料地區(qū)、小流域水文分析及分布式水文模型研發(fā)奠定技術(shù)基礎(chǔ)。因此,研究一套具有高密度、唯一性和高集成性的地理網(wǎng)格空間水文測(cè)站編碼體系勢(shì)在必行,同時(shí)也符合當(dāng)前浙江省數(shù)字化改革提出的各部門(mén)數(shù)據(jù)多源整合、共享共用的要求。
遵循GB/T 7027-2002《信息分類(lèi)和編碼的基本原則與方法》中定義的科學(xué)性、系統(tǒng)性、可擴(kuò)展性、兼容性與綜合實(shí)用性5項(xiàng)編碼原則[8],應(yīng)盡量減少人為因素影響,本文提出基于地理網(wǎng)格的水文測(cè)站編碼方法,將水文站編碼與地理空間的自然屬性相關(guān)聯(lián),根據(jù)站點(diǎn)屬性信息和地理網(wǎng)格自動(dòng)進(jìn)行測(cè)站編碼,有效提升了編碼的自動(dòng)化和標(biāo)準(zhǔn)化水平。
地理網(wǎng)格是一種對(duì)地理空間進(jìn)行位置劃分的方法,是將連續(xù)空間區(qū)域的平面離散化,即按一定規(guī)則進(jìn)行分割,形成許多網(wǎng)格單元,并賦予標(biāo)識(shí)符(即地理編碼)[9-10]。基于地理網(wǎng)格可以最大程度地匯集和共享網(wǎng)格內(nèi)分布的各種海量信息資源,為區(qū)域信息獲取、處理和應(yīng)用服務(wù)提供技術(shù)支撐。在多用戶(hù)、多平臺(tái)、多數(shù)據(jù)源的復(fù)雜異構(gòu)環(huán)境下,以網(wǎng)格為對(duì)象的編碼方式可以實(shí)現(xiàn)數(shù)據(jù)高效共享和數(shù)據(jù)集成[11]。目前,地理網(wǎng)格技術(shù)在交通管理、農(nóng)產(chǎn)品產(chǎn)地溯源等方面有著廣泛的應(yīng)用,成果顯著[12-13]。
將地理網(wǎng)格技術(shù)引入到水文測(cè)站編碼中,可以將分散的各類(lèi)水文要素信息,通過(guò)地理網(wǎng)格對(duì)象進(jìn)行空間組織,實(shí)現(xiàn)基于地理網(wǎng)格對(duì)象的多要素存儲(chǔ)模式和應(yīng)用體系。該編碼方法的總體思路為:采用規(guī)則網(wǎng)格預(yù)先對(duì)浙江省全域進(jìn)行兩級(jí)分區(qū),由基本網(wǎng)格和子網(wǎng)格組成為網(wǎng)格碼,網(wǎng)格碼結(jié)構(gòu)為DrrrBcccTxx;再編制不同測(cè)站類(lèi)型碼Kyy。網(wǎng)格碼與類(lèi)型碼組合成測(cè)站編碼DrrrBcccTxxKyy。根據(jù)水文匯集測(cè)站的經(jīng)緯度位置信息,采用自適應(yīng)技術(shù)自動(dòng)匹配至自動(dòng)編碼的地理網(wǎng)格中,構(gòu)建網(wǎng)格對(duì)象與站點(diǎn)的對(duì)照關(guān)系。總體目標(biāo)就是以網(wǎng)格為對(duì)象整合集成當(dāng)前分散的各類(lèi)監(jiān)測(cè)數(shù)據(jù)源,實(shí)現(xiàn)水文要素之間的關(guān)聯(lián),為基于地理網(wǎng)格的水文大數(shù)據(jù)應(yīng)用做好技術(shù)儲(chǔ)備。
1.2.1基本網(wǎng)格劃分
基本網(wǎng)格編碼采用組合代碼形式,將省域劃分為若干個(gè)方格狀的監(jiān)測(cè)區(qū),在經(jīng)、緯度1°內(nèi)劃分100個(gè)×100個(gè)的網(wǎng)格,每個(gè)網(wǎng)格跨度為0.01°,按自南向北、由西至東順序進(jìn)行行列編碼,劃分后得到的每一個(gè)網(wǎng)格都具有一個(gè)唯一的地址編碼與之對(duì)應(yīng)。該地址編碼由兩部分構(gòu)成:網(wǎng)格所在的行號(hào)、網(wǎng)格所在的列號(hào)。其中行號(hào)的定義是:網(wǎng)格在水平軸延伸方向的行數(shù),其中以起算點(diǎn)左下角網(wǎng)格為第1行。列號(hào)的定義是:網(wǎng)格在垂直軸延伸方向的列數(shù),其中以起算點(diǎn)左下角的網(wǎng)格為第1列。基本網(wǎng)格編碼形式如下:DrrrBccc。其中,D表示東經(jīng),B表示北緯;rrr為3位,表示測(cè)站網(wǎng)格所在垂直軸方向的列號(hào),由西至東順序編號(hào)為001~500;ccc為3位,表示測(cè)站網(wǎng)格所在水平軸方向的行號(hào),自南向北順序編號(hào)為001~500。浙江省域測(cè)站基本網(wǎng)格編碼示例見(jiàn)圖1。

圖1 浙江省域測(cè)站基本網(wǎng)格編碼示例Fig.1 Coding of basic grid of gauges in Zhejiang Province
1.2.2子網(wǎng)格劃分
考慮到全省部分地區(qū)水文測(cè)站集中度較高,有進(jìn)一步細(xì)分網(wǎng)格的需求,以及今后的拓展需求,在基本網(wǎng)格上進(jìn)行子網(wǎng)格的劃分,即在基本網(wǎng)格的基礎(chǔ)上進(jìn)一步劃分為10個(gè)×10個(gè)網(wǎng)格,子網(wǎng)格編碼形式如下:Txx。其中,T表示子網(wǎng)格拓展劃分;xx為2位,表示子網(wǎng)格所在基本網(wǎng)格劃分后的編號(hào),為0N~NN。以基本網(wǎng)格D001B001為例,測(cè)站子網(wǎng)格編碼彈性劃分示例見(jiàn)圖2。針對(duì)可能存在部分站點(diǎn)距離較近的實(shí)際情況,在實(shí)際編碼拓展中,N值默認(rèn)為9。

圖2 水文要素子網(wǎng)格編碼劃分示例Fig.2 Coding division of hydrological sub-element
1.2.3測(cè)站類(lèi)型碼
根據(jù)測(cè)站當(dāng)前主要開(kāi)展的水文監(jiān)測(cè)項(xiàng)目,制定水文測(cè)站類(lèi)型碼,以便于水文測(cè)站按類(lèi)型碼進(jìn)行歸類(lèi)。測(cè)站類(lèi)型碼見(jiàn)表1。

表1 測(cè)站類(lèi)型碼
考慮到測(cè)站種類(lèi)和數(shù)量的需要,測(cè)站類(lèi)型編碼形式為Kyy。其中,K表示測(cè)站類(lèi)型分類(lèi);yy為2位,第1位y代表不同水文測(cè)站類(lèi)型碼(表1),第2位y代表同類(lèi)型監(jiān)測(cè)站的數(shù)量(若存在多個(gè)同類(lèi)監(jiān)測(cè)站點(diǎn),編碼取1~9;若不存在,編碼取0)。
1.2.4自適應(yīng)編碼
利用站點(diǎn)經(jīng)緯度位置信息,采用自適應(yīng)技術(shù)自動(dòng)匹配至測(cè)站的地理網(wǎng)格中,結(jié)合測(cè)站屬性信息,自動(dòng)完成測(cè)站的地理網(wǎng)格編碼。針對(duì)水位、水質(zhì)、墑情等各類(lèi)已有測(cè)站編碼,建立唯一的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)以地理網(wǎng)格為單元匯集全部水文要素信息資源。地理網(wǎng)格編碼類(lèi)似身份證號(hào)碼,現(xiàn)有各類(lèi)測(cè)站編碼類(lèi)似不同銀行卡卡號(hào),通過(guò)關(guān)聯(lián)關(guān)系就可以實(shí)現(xiàn)對(duì)不同銀行卡的集中管理。地理網(wǎng)格編碼與原有測(cè)站關(guān)聯(lián)轉(zhuǎn)換關(guān)系示例見(jiàn)圖3。

圖3 水文測(cè)站地理網(wǎng)格編碼與原有測(cè)站關(guān)聯(lián)轉(zhuǎn)換示意Fig.3 Conversion between previous gauges and new geographical code grid
該編碼方案主要具有如下特點(diǎn):
(1) 有利于數(shù)據(jù)交換和共享。采用基于地理網(wǎng)格的測(cè)站編碼,每一網(wǎng)格的編碼都是唯一確定的,網(wǎng)格內(nèi)的信息高度集成,極大地方便了部門(mén)之間相關(guān)業(yè)務(wù)數(shù)據(jù)的交換和共享。
(2) 有利于數(shù)據(jù)應(yīng)用和拓展。通過(guò)網(wǎng)格編碼提取網(wǎng)格內(nèi)水文數(shù)據(jù)信息,為分布式洪水預(yù)報(bào)模型、水資源空間分析等水文業(yè)務(wù)在GIS條件下的應(yīng)用和拓展提供了極大便利。
(3) 編碼根據(jù)站點(diǎn)空間及屬性信息可預(yù)先自動(dòng)生成,且富有彈性,無(wú)需人為編輯,便于管理。編碼本身具有空間和屬性信息,方便分類(lèi)統(tǒng)計(jì),應(yīng)用便捷、高效。
(4) 符合大數(shù)據(jù)發(fā)展趨勢(shì)。地理網(wǎng)格化正逐漸成為信息化業(yè)務(wù)系統(tǒng)的一個(gè)發(fā)展方向,本文采取的地理網(wǎng)格編碼可以為大數(shù)據(jù)分析應(yīng)用奠定堅(jiān)實(shí)的應(yīng)用基礎(chǔ)。
雨量分析是水文分析計(jì)算的基礎(chǔ),如區(qū)域降雨分析、水量分析計(jì)算、洪水預(yù)測(cè)預(yù)報(bào)以及汛情信息發(fā)布都需要有雨量時(shí)間和空間分析。隨著水文分析的深入,需要對(duì)歷史、實(shí)時(shí)和未來(lái)降雨進(jìn)行融合分析。而采用傳統(tǒng)的基于站點(diǎn)的分析已無(wú)法滿(mǎn)足該分析要求,存在站網(wǎng)變動(dòng)大、歷史站點(diǎn)數(shù)據(jù)應(yīng)用困難、跨部門(mén)數(shù)據(jù)無(wú)法融合、空間分析精細(xì)化不夠等問(wèn)題,通過(guò)采用以地理網(wǎng)格為對(duì)象的編碼體系,可較好地解決上述問(wèn)題,并在流域洪水預(yù)報(bào)的時(shí)空演變分析中得到了較好的實(shí)踐應(yīng)用。
基于歷史、實(shí)時(shí)和未來(lái)降雨進(jìn)行分析和預(yù)報(bào)時(shí),發(fā)現(xiàn)傳統(tǒng)的以站點(diǎn)為對(duì)象的分析方法無(wú)法有效利用所有采集要素,主要存在以下4方面問(wèn)題。
(1) 歷史各年站點(diǎn)數(shù)據(jù)不統(tǒng)一。歷史水文數(shù)據(jù)序列長(zhǎng)度不一,有長(zhǎng)達(dá)百年之久的水文測(cè)站,也有5 a以?xún)?nèi)的水文測(cè)站,在進(jìn)行序列分析時(shí),針對(duì)站點(diǎn)進(jìn)行分析,無(wú)法形成完整的水文序列。
(2) 參與統(tǒng)計(jì)分析站點(diǎn)變化較大。隨著大量站點(diǎn)建設(shè)及跨行業(yè)數(shù)據(jù)歸集,測(cè)站密度激增,站點(diǎn)故障和相鄰融合等問(wèn)題凸顯,不同時(shí)間段可用于分析計(jì)算的站點(diǎn)會(huì)有較大差異,以點(diǎn)為對(duì)象統(tǒng)計(jì)分析存在不合理現(xiàn)象。
(3) 未來(lái)降雨與實(shí)時(shí)降雨格式不一致。未來(lái)數(shù)值降雨預(yù)報(bào)成果為網(wǎng)格對(duì)象數(shù)據(jù),傳統(tǒng)實(shí)時(shí)降雨以站點(diǎn)為對(duì)象進(jìn)行統(tǒng)計(jì)分析,格式無(wú)法兼容,須統(tǒng)一到基于站點(diǎn)或基于網(wǎng)格的格式進(jìn)行降雨統(tǒng)計(jì)分析。
(4) 流域內(nèi)的雨量時(shí)空分布無(wú)法精細(xì)化體現(xiàn)。以站點(diǎn)的點(diǎn)對(duì)象為基礎(chǔ)開(kāi)展面雨量分析計(jì)算,受站點(diǎn)密度限制無(wú)法實(shí)現(xiàn)小區(qū)塊的面雨量空間分析,只能概化為大區(qū)塊的面雨量過(guò)程,時(shí)空分布無(wú)法精細(xì)化,影響預(yù)報(bào)精度。
為了精準(zhǔn)掌控流域降雨時(shí)空演變態(tài)勢(shì),該案例采用了基于地圖網(wǎng)格的水文測(cè)站編碼,將多源水文要素進(jìn)行以網(wǎng)格為單元對(duì)象的空間地理編碼,實(shí)現(xiàn)站點(diǎn)從點(diǎn)到網(wǎng)格面的空間關(guān)系轉(zhuǎn)換,以便給予規(guī)則的網(wǎng)格面,可以按時(shí)間序列空間插補(bǔ)全域網(wǎng)格的數(shù)值,實(shí)現(xiàn)從網(wǎng)格面到全域面的時(shí)間序列空間賦值。結(jié)合水文分析的流域范圍,可以對(duì)全域面中的所有網(wǎng)格單元對(duì)象進(jìn)行特定空間范圍的提取。提取后可以按照時(shí)間序列實(shí)現(xiàn)面雨量計(jì)算、等值面填色、籠罩面積統(tǒng)計(jì)等二次空間分析。分析過(guò)程如圖4所示。

圖4 全域面降雨時(shí)空演變分析示意Fig.4 Demonstration of rainfall tempor-spatial evolution in whole region area
每個(gè)網(wǎng)格都通過(guò)網(wǎng)格編碼實(shí)現(xiàn)對(duì)象化身份認(rèn)證,并以網(wǎng)格編碼為索引進(jìn)行存儲(chǔ),通過(guò)開(kāi)發(fā)接口實(shí)時(shí)動(dòng)態(tài)調(diào)用任意時(shí)間段、任意網(wǎng)格數(shù)據(jù)。選定區(qū)域可以由一個(gè)子網(wǎng)格,也可以由任意多個(gè)子網(wǎng)格組成,結(jié)構(gòu)靈活,并與未來(lái)數(shù)值降雨無(wú)縫對(duì)接,為水資源分區(qū)統(tǒng)計(jì)、水質(zhì)水量同步分析、分布半分布等洪水預(yù)報(bào)模型的集成化應(yīng)用提供了技術(shù)支撐。
地理網(wǎng)格編碼體系較好地實(shí)現(xiàn)了點(diǎn)源與網(wǎng)格數(shù)據(jù)格式、本省和歐洲預(yù)報(bào)模式的多源數(shù)值預(yù)報(bào)降雨耦合,實(shí)時(shí)在線(xiàn)比對(duì)多源流域面雨量成果,為錢(qián)塘江分布式水文模型提供了精準(zhǔn)實(shí)效的實(shí)時(shí)和未來(lái)雨量數(shù)據(jù)。
錢(qián)塘江半分布式水文預(yù)報(bào)模型基于重點(diǎn)預(yù)報(bào)區(qū)域河流水系分段,將現(xiàn)有報(bào)汛的水工程和水文斷面作為劃分節(jié)點(diǎn),構(gòu)建產(chǎn)匯流網(wǎng)格與河流之間的匯流網(wǎng)絡(luò)模型。通過(guò)地理網(wǎng)格編碼體系為洪水作業(yè)預(yù)報(bào)平臺(tái)輸入高精度的網(wǎng)格化歷史和實(shí)況降水量數(shù)據(jù)等,通過(guò)參數(shù)率定模塊開(kāi)展半分布式模型參數(shù)的率定。
2021年6月30日至7月2日,錢(qián)塘江中上游出現(xiàn)較強(qiáng)降雨過(guò)程。錢(qián)塘江半分布式水文預(yù)報(bào)模型于6月30日14:00,根據(jù)實(shí)況點(diǎn)降雨和未來(lái)數(shù)值降雨預(yù)報(bào)成果,開(kāi)展實(shí)時(shí)作業(yè)預(yù)報(bào)。通過(guò)站點(diǎn)降雨網(wǎng)格化、統(tǒng)計(jì)實(shí)時(shí)和未來(lái)各分區(qū)面雨量過(guò)程、調(diào)用半分布式水文預(yù)報(bào)方案等流程,預(yù)報(bào)常山以上流域各子流域河流節(jié)點(diǎn)的洪水過(guò)程。其中流域出口斷面的常山水文站洪峰流量4 890 m3/s,實(shí)測(cè)洪峰流量5 060 m3/s,相較于集中式模型預(yù)報(bào)的洪峰流量4 370 m3/s,在預(yù)報(bào)精度和洪水過(guò)程擬合度方面都有明顯提高。通過(guò)采用地理網(wǎng)格編碼體系,將有利于進(jìn)一步細(xì)化流域預(yù)報(bào)單元,實(shí)現(xiàn)從傳統(tǒng)集中式預(yù)報(bào)向分布式預(yù)報(bào)的發(fā)展,預(yù)報(bào)對(duì)象將逐步從固定斷面向區(qū)域內(nèi)的任意網(wǎng)格單元拓展。
為了更好地實(shí)現(xiàn)對(duì)海量水文數(shù)據(jù)進(jìn)行集成管理、分析、共享、應(yīng)用和發(fā)布,結(jié)合水文信息的現(xiàn)代化服務(wù)需求,本文提出了基于地理網(wǎng)格的測(cè)站編碼方法,制定了網(wǎng)格編碼規(guī)則,建立了網(wǎng)格內(nèi)各類(lèi)測(cè)站編碼與網(wǎng)格編碼之間的關(guān)聯(lián)關(guān)系。上述成果實(shí)現(xiàn)了當(dāng)前水文分析從點(diǎn)到面的跨越,打破了數(shù)據(jù)時(shí)空變化造成的融合壁壘,拓展了水文數(shù)據(jù)的深加工和分析服務(wù)能力,有利于水文大數(shù)據(jù)技術(shù)的應(yīng)用和分析,為后續(xù)水文數(shù)字化服務(wù)提質(zhì)增效奠定了堅(jiān)實(shí)的基礎(chǔ)。