文/岑瑤
(內蒙古自治區氣象信息中心 內蒙古自治區呼和浩特市 010051)
數字化技術[1]是將圖片、文字、聲音、影像等各種信息,通過一定的電子設備將其轉化為“0”和“1”組成的電子計算機語言,進行信息的獲得和根據需求的需要的變換處理等的技術。近些年,氣象方面的相關專家對數字化圖像處理技術在氣象領域的應用進行了很多研究:趙曉莉等[2]將數字化中的圖像處理技術應用于氣象方面的風向自記紙的處理上,提出了一種由風向跡線自動跟蹤提取、風向判斷等功能組成的EL型風向自記紙圖像信息自動識別方法;吳興洋等[3]利用數字化技術對降水自記跡線及雨量數據進行了提??;趙迦琪等[4]應用數字化技術集成了一個集跡線提取、質量控制、數據集于一體的綜合性降水自記紙識別系統軟件。
隨著數字化圖像技術的廣泛應用和氣象信息事業的迅猛開展,為了滿足對紙質氣象數據永久性保存的需求,避免因為時間長、年代久遠、保存條件差等導致的氣壓自記紙破損、字跡變淡、變質等現象,急需應用現代化圖像處理技術對氣壓自記紙的數據進行數字化存儲。依照之前一些專家的科研研究,自記紙實現數字化一般要經過圖像掃描、圖像校正、圖像識別、數據訂正、數據存儲的過程,其中圖像識別尤其是圖像的預處理過程特別關鍵。本文中主要討論氣壓自記紙的圖像識別過程。
圖像的預處理過程一般包括:數字化處理、灰度化處理、二值化處理、幾何變換、歸一化處理和圖像增強等。自記紙的圖像識別過程中常用到的技術是:增強、幾何變換、二值化。
數字化通常是指:將人們通過掃描或拍照等方式得到的原始圖片通過一些既定的方法比如采樣、量化等,將其在M×N點陣上進行數據化,轉化為計算機能夠進行讀取和處理的形式的一種方法。圖像數字化實際上也是一個在空間坐標和幅度上對采集的原始圖像進行離散化處理的過程。
圖像的幾何變換實際上是其的空間變換[6],由于人工采集或者是采集儀器等的原因造成采集到的圖像存在失真、偏移等現象,需要通過空間變換的方式如平移、旋轉、縮放等對其進行一定程度的處理,以修正由于人工原因(成像角度的設置)和采集裝置(鏡頭等)而造成的圖像的誤差。
圖像的二值化處理通俗的來講就是將圖像上的每個像素點的灰度值轉換為純黑或是純白來表示,也就是將人們采集到的圖像通過二值化轉換為由黑白兩種顏色構成的圖像。在對圖像進行數字化處理的過程中,對其進行二值化的處理特別的關鍵,是實現圖像自動化識別的重要環節之一。首先,對圖像進行二值化處理可以將圖像轉化為純色的黑白圖像,使圖像所包含的信息更加的清晰,感興趣的區域更加明顯分辨。要想將得到的彩色圖像轉換為二值化圖像,首先需要將其處理成灰度圖像,常用的算法如下:

圖1:氣壓自記紙處理流程圖
r=g=b=0.30r+0.59+0.1b
r,g,b表示彩色圖像的R,G,B分量的數值。
一般為了能夠獲得滿足識別要求的滿意的二值圖像,通常結合圖像分割技術中較常用的閾值分割技術,對其進行圖像包含主要信息的目標區域與背景的分割。這種方法計算簡單而且易于使用,可以用封閉、連通的邊界有效的分割出目標區域。
通常對于人的肉眼來說,想要從一幅不是很清晰的圖片中找到自己想要的信息還是比較容易的,但是同樣一件事要是交給計算機的話,就沒有想象中的那么簡單了。為了能夠讓計算機比較精準的定位到我們的感興趣區域,需要對采集的圖像進行一系列的預處理。圖像增強是一種提高獲取的原圖像顯示效果和視覺感覺的使圖像變得更加清晰的圖像處理技術。其一般可以針對圖像的使用場景和用處來有效的增強其所包含的感興趣信息,針對性的凸顯圖像中某些有用的整體或部分特征,使原圖像的質量得到進一步的提升,信息量得到進一步的凸顯。

圖2:坐標變換
圖像增強算法一般由直接增強的空間域法、間接增強的頻域法和小波域法組成[7]。空間域法是直接對圖像所包含的像素進行增強的一種算法。比較常用的有空間域法中的與灰度相關的灰度變換方法、與對比度相關的對比度增強法和用于去除噪聲的中值濾波,小波域中的與時間和頻域有關的小波變換。小波變換是對傅里葉變換進行優化的一種方法,將其得到的頻譜擴展為了時頻譜。頻域法是從信號的組成方面考慮對信號進行增強的一種方法,通過設定一定的頻率值點來選取需要的感興趣信號。
如圖1所示,氣壓自記紙實現數字化一般也要經過圖像掃描、圖像校正、圖像識別、數據訂正、數據存儲的過程。其過程一般是:首先,通過人工手動的方式利用掃描儀將氣壓自記紙掃描成統一大小的圖片。由于人工手動的方式難免在掃描的過程中出現掃描圖片歪斜的現象。自記紙本身也存在著變質、字跡模糊和變淡、浸墨等現象。上述的這些現象都需要在對圖像進行預處理和識別的時候進行處理。對于通過識別提取的數據還需要進行數據的對比和誤差分析,最后進行數據的訂正得到指定格式的數據集。下面重點介紹一下圖像識別部分。
由于圖像是通過人工手動的方式批量進行掃描的,難免因為人為的因素、外部的一些干擾因素,如掃描儀、灰塵等造成得到的掃描圖像出現圖像不完整或干擾彩線、或因為圖像破損掃描的黑色部分。故需要對圖像進行完整性的檢查,對不完整的圖像進行重新掃描。
通過掃描儀得到的圖像,有些雖然是完整的,但是難免會出現位置偏差、清晰度不夠、顏色和亮度存在偏差等問題的圖片。這樣,就需要對其進行圖像的校正。如果圖像是出現位置偏差,需要對其位置進行校正調整;如果是清晰度不夠,略顯模糊,需要對其進行圖像增強處理;如果是顏色和亮度的問題,則需要對其亮度、曝光度、對比度等指數進行微調。
在對氣壓自記紙進行處理時,先對圖像進行二值化處理,將圖像處理成易于識別的黑白圖像:圖像的背景為白色,氣壓曲線為黑色。閥值的確定,是按照文獻[5]所得出的具體取值進行選取的,采用了硬閥值法,閥值設為128。
氣壓自記紙在掃描和數字化的過程中常受到采集、成像設備和外部由于不可抗原因存在的一些干擾因素的影響,有些自記紙本身就有人工記錄的痕跡也會對圖像造成一定程度的影響,所以圖像去噪對于自記紙的識別也是特別的重要。常用的去除圖像噪聲的方法有:均值濾波器、自適應維納濾波器、中值濾波器、形態學噪聲濾波器、小波去噪等方法。針對本文的氣壓自記紙圖像特點,選取中值濾波器進行圖像去噪。
對氣壓自記紙進行上述步驟的處理后,可以從圖像中的黑色氣壓線來提取其坐標值,然后進行坐標轉換將坐標值轉換為氣壓與時間的刻度值。
在氣壓自記紙處理中,默認氣壓為100hpa的刻度線為Y軸,任意時間刻度線的切線為X軸,時間刻度是一系列沿著橫坐標連續變化的弧,弧的曲率半徑為R=140mm。自記紙圖像經過掃描可得到任意時刻氣壓值點的直角坐標,在上圖中,B為任意時刻的點,其橫坐標為Bx,縱坐標為By,橫坐標為具體的氣壓值,縱坐標為時間刻度,因為時間刻度為弧線,因而B點的縱坐標并不是其真正的時間刻度坐標,必須要進行轉換。根據圖2所示,B點的時間刻度坐標Bt 可由以下公式得出:

所以,B點在X,Y軸上的實際坐標為(Bt,By),根據縱坐標像素值所對應的時間序列,橫坐標像素值所對應的氣壓序列,就可以計算出B點所對應的時間刻度和氣壓刻度了。
隨著數字化圖像技術的廣泛應用和氣象信息事業的迅猛開展,為了滿足氣象方面的業務需求,將數字圖像處理技術應用于氣象業務的相關方面進行圖像處理,能夠使氣象數據更加準確精細,更有利于其在氣象服務中的應用。本文將數字圖像處理技術應用于氣壓自記紙的數據數字化存儲中,可以極大地避免因為時間長、年代久遠、保存條件差等導致的氣壓自記紙破損、字跡變淡、變質等現象造成的數據丟失和不完整,可以進一步進行細致的研究進行業務化的應用。