趙曉莉,苑 躍,黃曉龍,劉相全
(1.四川省氣象災害防御技術中心,四川 成都 610072;2.四川省氣象探測數據中心,四川 成都 610072;3.重慶眾仁科技有限公司,重慶 408000)
自20世紀60年代初,全國逐步開展風向風速自動觀測,主要使用EL型電接風向風速計和達因式風向風速觀測儀器,并以自記紙的形式保存了近40 a的風向風速歷史資料[1]。風自記紙是寶貴的客觀表征風向風速日變化的唯一實測的基礎資料,進行數字化處理后,這些資料對于研究我國風向風速特征研究具有重要意義[2];將為開發利用風能資源、預防風災以及城市建設、環境保護等提供權威的基礎氣象科學數據[3-9]。
全國已完成EL電接風向風速自記紙的圖像掃描工作,數字化自記紙圖像中數據的自動識別將成為亟待解決的問題。本文根據《地面氣象觀測規范》(2003版)[10]中對EL型電接風自記紙整理規范要求,研究EL型電接風自記紙風向數字化識別方法,并對該方法開發的風向提取軟件的風向識別效果進行檢驗。
EL型電接風向風速計是一種由風速風向傳感器、指示器和記錄器3部分組成的風向風速有線遙測儀器。記錄器由8個風向電磁鐵、1個風速電磁鐵、自記鐘、自記筆、筆擋、充放電線路等部分組成[11-14]。每兩個磁鐵為一組控制一支記錄筆,當控制風向記錄時刻的繼電器吸合時,與風向標所在方位的方位塊相對應的電磁鐵吸動,控制相應的記錄筆記下風向標所在方位。
EL型電接風向風速自記紙上的數據是記錄器記錄所得,分為兩個部分:上部為風向,由4根平行線分割成8份,按照從上到下的順序分別表示S、N、NE、SW、E、W、SE、NW 8個風向,剩余8個風向(NNE、ENE、ESE、SSE、SSW、WSW、WNW、NNW)則通過記錄器在同一時間兩個記錄筆同時畫下的風向線組合得到;下部為風速,按空氣行程200 m電接1次,風速自記筆相應跳動1次來記錄,正點前10 min內的風速根據跡線通過自記紙上平分格線的格數(1格相當于1.0 m/s)計算[15-22]。
根據《地面氣象觀測規范》(2003版)對EL型電接風向風速計自記整理的要求,自記紙從各正點前10 min內的5次風向記錄中挑取出現次數最多的。如最多風向有兩個出現次數相同,應舍去最左面的1次劃線,而在其余4次劃線中來挑取;若仍有兩個風向相同,再舍去左面的1次劃線,按右面的3次劃線來挑取。如5次劃線均為不同方向,則以最右面的1次劃線的方向作為該時記錄。
風自記紙經掃描后形成的自記紙數字圖像會有輕微的傾斜或變形,需要通過圖像預處理糾正這些錯誤,以保證數據的精度。通過局部投影取極值,找長直線,即對應邊界線的準確位置;再根據找出長直線的傾斜角,獲取圖像的傾斜角,并對圖像進行傾斜校正。
根據業務要求,觀測員每天需對風自記紙進行整理,并將人工從自記紙上讀取的數據記錄在風自記紙上,這樣勢必造成人工字跡影響風向、風速跡線的情況。因此,需要刪除干擾跡線的人工字跡,以保證后續跡線自動識別的準確性,一般通過對紅(R)、綠(G)、藍(B) 3個顏色通道閾值的設置區分人工記錄的鉛筆字跡與風向、風速自記跡線。
風向風速自記紙掃描要求24位彩色,標準掃描分辨率為200 DPI,為了提高圖片質量,掃描分辨率一般大于200 DPI。計算機圖像處理中,圖像的色彩是通過對紅(R)、綠(G)、藍(B) 3個顏色通道的變化以及它們相互之間的疊加來得到各式各樣的顏色。自記紙圖像中,底色和坐標的紅色分量較大,綠色和藍色分量較小,而風向、風速跡線的紅色分量相對較小,綠色和藍色分量較大;綜合效果看,曲線與底色、坐標色的灰度差異不如單純的紅色差異顯著。因此,區分底色與風向、風速跡線采用紅色分量作為閾值條件。一般情況下,以小于等于200判定為風向、風速跡線,大于200判定為底色和坐標背景信息,以此來區分自記紙底圖坐標與跡線,最終提取風向跡線,如圖1所示。
根據風向線自記紙的特征將風向線數據提取分成4個子圖單獨處理,每個子圖處理包含2個步驟:①根據風向線與底圖分離后風向線點集自動獲取風向線所在位置;②人機交互。
根據記錄器每2.5 min記錄一次瞬時風向的規則,設有風向為1,無風向為0。將風向軸線上下1/3軸線距矩形區域(如圖2所示)是否有豎直投影作為風向的判別依據。若同一時次風向軸線上部、下部均有投影,則根據投影值的大小進行判別,投影值大認為有風向記為1,對應時次投影值相對小的則記為0;若同一時次風向軸線上部、下部均無投影,則對應時次均記0。以圖2風向線子圖中14時30分風向跡線為例,以風向軸為分界線,分別計算該時刻風向軸上部和下部風向跡線的像素點之和,而后求差值,結果小于0,說明下部投影值大于上部,故下部風向應記1,上部風向記0。
將4個風向線子圖同一時刻風向判別結果(即8×1的數組),作為該時刻瞬時風向記錄。以某站17時正點前10 min風向自記為例(如圖3所示),綠色框內的8×1的數組為17時正點的瞬時風向數組,利用風向組合規則(如表1所示),判斷該時刻瞬時風向為ENE。按照上述方法判斷17時正點前10 min內的5次瞬時風向均為ENE,故17時10 min風向為ENE。

圖1 風向跡線提取前后對比圖Fig.1 Contrast map before and after wind direction trace extraction(a, Part of wind self-recording paper, b, Recognition of the wind direction trace)

圖2 風向線子圖處理區域示意圖Fig.2 Subgraph of wind direction line processing area diagram

圖3 瞬時風向判別示意圖Fig.3 Diagram of instantaneous wind direction discrimination

表1 瞬時風向識別對照表Tab.1 look-up tab of Instantaneous wind direction recognition
人機交互是通過人工手動操作的方式修正自動跟蹤錯誤的風向線的過程,包括對風向線進行增加、刪除及修改。通過鼠標點擊風向記錄線的方式進行個別風向線增加和刪除。人工修改大面積風向線通過繪制等距風向線實現:鼠標框選需要修改的風向線大致范圍,在鼠標點擊附近搜尋第一根和最后一根風向線位置,根據風向線間最大長度以及搜尋的第一根風向線和最后一根風向線之間的長度綜合計算風向線平均間距,等間距繪制新的風向線用于替換修改區域內原有風向線。
根據上述EL型電接風自記紙風向數字化識別方法研發了EL型電接風自記紙數字化軟件,并隨機對11個臺站100張EL型風速風向自記紙(如表2所示)共計2 400個風向正點值進行了效果測試。

表2 測試臺站及測試EL型風自記紙數量Tab.2 Test station and EL wind self-recording paper quantity
為了驗證風向識別方法的可用性,將軟件識別的正點10 min風向與全國地面氣象資料A6文件中的數據進行對比,其中,A6文件中的正點10 min風向為人工整理EL型風自記紙讀取的記錄。風向完全一致認為軟件提取風向數據正確,不一致則需要人工核查風自記紙,判斷是否是由于人工讀數錯誤造成不一致。如表3所示,風向一致率較高,軟件提取風向數據正確率達97.2%;人工讀取錯誤導致的不一致占2.7%;軟件讀數錯誤僅占0.2%。軟件讀取風向錯誤主要與圖像中跡線的清晰程度有較大的關系,圖像跡線越清晰軟件讀取正確率越高,且正確率優于人工讀取。以綿陽站(56 196)為例,該站自記紙圖像較為清晰,風向線整齊有序,測試該站1個月的風自記紙圖像,僅有15個風向與A6文件不一致,經核查這15個風向均為人工讀數錯誤。

表3 測試結果與A6文件對比Tab.3 Comparisons between test results and A6 files
本文主要介紹軟件風向識別算法,算法以《地面氣象觀測規范》(2003版)中EL型電接風自記紙整理規范為依據,參考人工讀取EL型電接風向風速自記紙方式建立。利用該識別算法開發的EL型電接風自記紙數字化軟件,從測試結果可見,基于風向識別算法開發的EL型電接風自記紙數字化軟件風向識別正確率達97.2%,表明本文研究的風向識別方法可以應用到EL型電接風自記紙數字化處理中。