代 斌,施 藝
(四川省成都水文水資源勘測中心,成都 611130)
水文學(xué)是研究水資源、水循環(huán)和水環(huán)境的科學(xué),涉及大量的水文數(shù)據(jù)。隨著信息技術(shù)的快速發(fā)展和數(shù)據(jù)采集技術(shù)的成熟,水文學(xué)領(lǐng)域也迎來了大數(shù)據(jù)時代。在目前的大數(shù)據(jù)環(huán)境下,水文數(shù)據(jù)的數(shù)據(jù)量呈現(xiàn)爆炸式增長,傳統(tǒng)的數(shù)據(jù)處理方式已經(jīng)無法滿足需求,數(shù)據(jù)抽稀成為了處理數(shù)據(jù)的一種關(guān)鍵技術(shù),也是現(xiàn)在水文數(shù)據(jù)管理和分析的必要手段。
水文數(shù)據(jù)抽稀是指在保持水文數(shù)據(jù)重要特征的同時,從原始水文數(shù)據(jù)中有選擇地減少數(shù)據(jù)點的數(shù)量,以達到減少數(shù)據(jù)量、提高計算效率、降低存儲成本和提高數(shù)據(jù)質(zhì)量的目的。
目前來說抽稀較為常用的算法有:等步長法、線段過濾法、垂距限值法及Douglas-Peuker算法。
水文數(shù)據(jù)是按時間順序排列的數(shù)據(jù)點集合。等步長法是按照一定的間隔距離對點集進行抽取,其余點全部壓縮掉,在相鄰抽取點間用直線連續(xù);線段過濾法是從點集的第一點開始,若連續(xù)兩個點組成的線段長度比給定的閾值小時,刪除這兩點,并將這兩點的中點插入兩點原來的位置;垂距限值法是從點集的第一點開始,根據(jù)中間點到前、后兩個相鄰點連線的距離,來確定是否保留該點的一種抽稀算法,當(dāng)距離大于給定的閾值時保留該點,否則刪除該點;Douglas-Peukcer算法是計算點集中除頭尾兩個端點外的每個點與頭尾兩點直線之間的垂直距離,若這些距離的最大值小于給定的閾值就刪除這一組點,若大于給定的閾值,則從最大距離處將點集分為兩部分,繼續(xù)以上步驟,該算法以遞歸方式應(yīng)用于這兩個部分,直到達到所需的簡化級別[1]。……