張春艷 陳國勇
嵊州市氣象局,浙江紹興 312400
浙江致災強風暴監測預警系統自動站子系統前期資料處理方法研究
張春艷 陳國勇
嵊州市氣象局,浙江紹興 312400
為應用自動站資料及其他一些中尺度模式產品建立客觀臨近預報業務系統,對自動站前期資料處理時采用的技術方法進行了研究,介紹了原始資料的質量控制方法、離散點資料的細網格差分方法以及對表征中尺度天氣系統的特征物理量的選取,結果表明,前期處理考慮了地面的復雜因素,提取了一些有用的特征量,能夠較好地滿足強天氣監測預警與服務系統研發的要求,為自動站子系統及其他個子系統的研究提供了基礎數據。
自動站資料;質量控制;加權平均內插法;中尺度分析

圖一
按照“浙江省小流域致災強風暴監測預警技術研究”的總體要求,自動站子系統作為基于細網格的浙江省強天氣監測預警與服務系統的一個分支,目標是在“基于細網格的浙江省強風暴天氣監測預警與服務系統”整體框架下,利用自動氣象站資料,將全省及周邊區域自動氣象站網監測信息按要求網格量化,建立一套基于0. 1度×0.1度經緯網格有限區域為預警單元的、基于細網格的浙江省強風暴天氣監測預警與服務實時業務系統自動站子系統,完成自動站監測預警從定性到定量的精細化預報的轉變,從主觀到客觀的作業方式的轉變。
該系統建設的重點就是快速獲取全省及周邊自動站的實況降水、風、氣壓、溫度等站點資料,充分分析和利用現有自動氣象站站點資料,并加工計算產生格點資料及物理量資料,快速地進行有限區域各種地面要素和物理量的客觀分析,得到強風暴天氣的相關信息,采用一定的預報技術方法,計算以半小時為步長的預報場,從而達到對強天氣的監測和預警。這就對地面自動站資料的前期處理提出了更高的要求, 由于地面自動站資料時空密度大,地形復雜,以往的常規資料處理手段已難以適應高分辨率資料處理和解釋的需要。為此,針對原始資料的特點,這里探討了地面高時空分辨率資料處理中需要解決的幾個關鍵問題,處理結果也表明,處理的技術方法在前期資料處理中具有極其重要的作用,它直接影響了數據的可靠性和精度及后期預報產品的開發。前期資料處理流程圖如圖一
1.1 資料收集
資料通過業務寬帶網和“9210”工程收集,省內臺站自動站和中尺度自動站原始資料來源于省局FTP服務器。原則上,對于本地即可獲取的資料即可以就近原則獲取,無需下載。資料收集子系統具體由資料下載模塊實現。
資料下載模塊是系統中的一個FTP資料下載工具。對于省內資料,首先通過查詢數據庫得到需要入庫站點列表,再排除本地已經存在的文件,然后向FTP服務器請求下載。下載時做一些技術處理:首先判斷該文件在服務器存在與否,然后獲取文件的大小,只有符合規定的文件才下載到本地。殘缺資料(如中尺度資料規定227字節,而文件大小小于200字節)下載到本地后入庫時只能做無效舍棄,因此此程序特別注意了下載時就排除了此類文件,提高了工作效率。周邊省份數據是通過9210系統下發的打包資料,也可以看作本地資料,只要直接根據包中文件入庫即可,允許指定下載或直接讀取。
為避免程序FTP下載過程中會異常終止,在程序設計時還采用了兩項技術:一是由FTP服務器端控制下載進程,以保證連接的穩定性;二是采用多重異常處理控制,如“try…except”語句,保證程序的穩定性和容錯性。
本部分采用Delphi7結合數據庫技術編程實現,系統涉及數據庫和計算機遠程網絡通信技術,網絡流量和下載效率是設計中必須考慮的問題,而網絡通信過程中的軟件穩定性和容錯性十分重要。
1.2 質量控制
為保證系統的運行效率,這里對自動站數據中異常的部分進行質量控制預處理,在第一時間排除掉異常資料,主要有野值處理、異常資料的處理、缺漏資料的處理等。判斷依據主要有自動站規律性錯誤數據,以氣候資料為背景、以統計檢驗為依據、結合空間檢驗的綜合檢驗方法,同要素前后時次的比較、同時次各要素的相互關系判斷等。
1.3 資料入庫
資料入庫由資料入庫模塊實現。對于省內資料,首先獲取已經入庫的站點列表,再搜索已下載的數據資料,根據站點列表排除那些已經入庫的站點,然后對未入庫資料進行入庫;對于省外資料,先預處理報文,然后根據報文規定逐一入庫即可。
為提高資料處理效率,將資料入庫的有關信息保存在參數文件中,記錄入庫時間和各時次新入庫的站點數量,以此規定需要后續處理或免處理的時次,提供給要素分析處理系統,有效縮短了資料處理的時間。比如在某一時次的入庫時沒有新增資料,那么后續運行的要素分析處理將跳過這一時次,而不再重新整理。
為排除部分異常數據,外置了參數文件,對資料的有效范圍作出規定及排除。
本部分主要涉及數據庫技術,數據庫的操作效率、數據庫兼容性、異常資料的初級排除是其中的要點。
整個系統的運行是基于細網格的,而基本數據庫中的數據是分散的,必須對基本的自動站資料進行提取加工,分析得到一些特征量,方能保證系統后續一系列工作的進行,這里包括站點資料的獲取、細網格差分、再對網格化資料進行物理量計算分析,特別是差分方法的選取尤其重要。
2.1 獲取初始站點資料
利用省局自動站資料數據庫,數據庫類型為MS SQL Server或Oracle遠程數據庫,與服務器連接采用ADO方式連接,定時從數據庫查詢北緯25~33度、東經116~124度區域內及周邊3個經緯度內的所有站點的實況資料,即離散點資料,目前包括溫度、最高溫度、最低溫度、1小時變溫、露點溫度、溫度露點差、總溫度、1小時變壓、3小時變壓、氣壓擾動量、比濕、相對濕度、1小時降水量、3小時降水量、6小時降水量、1小時極大風速等溫壓濕風等氣象要素站點值。資料范圍:北緯25~33度、東經116~124度區域內所有自動站,為插值需要,向外延伸了3個經緯度,即北緯22~36度、東經113~127度范圍區域。
2.2 自動站資料的細網格差分
系統要求的數據網格大小為0.05×0. 05度,預警單元信息網格0.1×0.1度。在北緯25~33度、東經116~124度區域內,建立0.05×0.05度的精細網格,每個預警單元含有九個格點。而我們獲得的第一手資料是不連續的站點資料,要實現細網格,就要通過空間差分,把不連續的轉化為連續的,從自動站信息中提取特征量,經過客觀分析和處理,所有信息全部差分到0.05×0.05經緯網格點上,得到溫、壓、濕、風等氣象要素場,并存入自動站相關特征量數據庫。流場和比濕場資料為物理量的計算提供依據。
2.2.1 插值方法的選取
插值的方法有很多種,但由于地面資料的特殊性,經過試驗比較,自動站資料網格化處理過程最終決定采用用于為數值試驗準備資料的資料預處理方法,就是將離散分布的測站數據站點資料利用加權平均內插法插到范圍為116~124°E,25~33°N,分辨率為0.05×0.05°的區域網格點上(161×161)。
2.2.1.1 插值原理
其基本原理如下:對于某一格點,這里掃描半徑取0.5個經緯度(該半徑可根據具體需要調整,太大太小都容易造成虛值產生)。若掃描區內只有一個或兩個值,則不計算,否則按如下方法進行處理:

其中,wi為權重,與距離成反比關系;ri為資料點到內插點的距離;a為權重系數,已經給出的是在非地面層上的數據,我們要研究的資料因為是地面要素,經過測試取5.0較為合適;△xi為格點與資料點之間在x方向上的距離(km);△yi為格點與資料點之間在y方向上的距離(km);fi為加權平均內插值;fi為該要素在第i個站點上的值。
2.2.1.2 掃描半徑
對于某一給定格距網格上的格點,掃描半徑可根據具體需要調整,太大容易造成虛值產生,太小又不能進行正常插值計算。由于目前關心區域內站點密度基本為5~15km一個站點,為保證進行插值,掃描半徑內必須有三個站點以上,因此這里取0.5個經緯度,經過驗證,效果較好。
2.2.2 實現思路
為保證數據處理的計算速度,插值部分采用數值計算方面比較具有優越性的fortran語言編程,插值區域25°~33°N、116°~124°E,網格大小為0.05°×0. 05°。實現的思路如下:
第一步:讀取站點資料到各要素一維變量T0、TH、R1……等
站點資料文件格式如下:
年月日 時 站點數
緯度 經度 溫度 最高溫度 最低溫度…… V方向分量
以后依次排列各站點所有要素值
舉例如下:

……
第二步:對各要素站點值進行插值Call mkgrd(Lat,Lon,NC,T0,T0gd)
所有的插值只需調用子例行程序mkgrd即可,輸入站點資料,輸出格點資料:
首先排除缺測的站點,表現為-9999.,只對有效的站點進行插值,提高效率。對于參與插值的站點資料少于三個的,不進行插值,所有格點值設為-9999.。

由于項目要求保留極值,為了保證極值的完整性,這里對所有的站點資料采用最近距離法移位到網格各點里面最近的格點上,代替此點數據。
2.3 對細網格數據進行中尺度物理量分析
在日常的預報工作中,比濕、水汽通量、水汽通量散度、渦度、散度等物理量在預報重大天氣過程中有較高的參考價值,因此,這里也利用上面計算得到的161*161網格的基本要素網格點資料計算這些物理量,進行中尺度分析,產生中低壓、中高壓、散度、渦度、流場、水汽通量、水汽通量散度場等的網格化資料,只是在分析時縮小等值線間距,以發現中小尺度系統的存在。針對地面特征以及所研究天氣系統的尺度,中尺度分析引入了總溫度能量場、氣壓擾動量。在做物理量計算時,能夠直接由站點資料計算得到的物理量均計算出站點物理量再進行細網格化,其他物理量利用細網格化后資料直接計算所得。
①溫度場分析:分析溫度場和變溫,揭示高溫舌、局地迅速增溫區。
②氣壓場分析:用0.5或1 hpa間隔繪制海平面氣壓等壓線,可確定中尺度系統的位置、性質及變化,氣壓場較弱時,配合分析變壓ΔP1、ΔP3。氣壓擾動量計算,用3小時逐時氣壓加以平滑,可得“未受擾動氣壓”,與實際氣壓之差即為氣壓擾動量,可發現擾動周期為1~2小時的中小尺度系統。
③水汽場分析:水汽通量與流(風)場結合,了解水汽是如何進入或離開分析區,可跟蹤水汽的來源與輸送情況,注重分析水汽通量梯度和上游水汽通量中心的配置及水汽通量散度輻合中心。

④風、散度、渦度場分析:分析中尺度輻合線、渦旋輻合區,結合散度、渦度場,分析地面影響系統及變化。

⑤總溫度能量場分析:強烈天氣過程總是存在著能量的積累和釋放,這里增加了總能量場的計算。運用T,Z,Q計算總溫度值,由于總溫度綜合表示了溫度、氣壓、水汽各要素,分析總溫度能量場又可彌補分析溫度場受地形影響較大的不足,有利于了解氣團屬性的演變,與風場輻合區配合,將指示未來不穩定區的形成和加強。
總溫度:TT=T+9.8Z+2.5q,插值后得到總溫度場的分布。
⑥降水量場分析:定義1小時降水量≥10mm等雨量線閉合區域表征中尺度雨團,逐時演變分析雨團的范圍、移動及強度變化。
由于地形差異較大,地面風場較亂,散度、渦度場、流場以及水汽通量、水汽通量散度場等物理量場的分布較亂,并不能反映中小尺度天氣系統的真正狀態,不能作為指標,只能作為參考。對于地面要素,總溫度能量場的引入綜合表示了溫度、氣壓、水汽各要素,分析總溫度能量場又可彌補分析溫度場受地形影響較大的不足,有利于了解氣團屬性的演變,與風場輻合區配合,將指示未來不穩定區的形成和加強,是最具有指示意義的特征量。
以上基本要素的客觀分析及物理量場的計算由物理量分析模塊實現,對于渦度、散度、水汽通量、水汽通量散度等由地面流場和比濕場計算所得,其他物理量場直接由離散點資料差分得到,這些物理量為強天氣監測和預警提供了最基本的資料,也為計算以半小時為步長的細網格預報產品提供了初始場。
2.4 細網格資料上傳入庫
差分后所得細網格數據及計算所得物理量數據全部根據要求上傳到省局細網格數據庫,供自動站子系統及其他各子系統調用,目前數據時間間隔為1小時一次,以后可根據需要,加密到半小時或者10分鐘一次。
(1)對自動站資料的質量控制預處理包括野值處理、異常資料的處理、缺漏資料的處理等,基本可以排除掉所有的不正常資料,但對于用現有方法無法判斷的錯誤數據,只得力求觀測儀器運行的正常,以保證資料的正確性。
(2)對于地面上離散點資料的細網格差分采用了常用于為數值試驗準備資料的資料預處理方法加權平均內插法,掃描半徑取該半徑可根據具體需要調整,太大太小都容易造成虛值產生,經過試驗調整,這里采用0.5個經緯度,這也是與地面站點的分布以及所研究天氣系統的尺度有密切關系的,插值后得到的數據較為合理。隨著中尺度自動站點的加密,這個半徑還需調整。
(3)由于地形的復雜性,在地面層上所做的散度、渦度場、流場以及水汽通量、水汽通量散度場等物理量場的分析并不能反映中小尺度天氣系統的真正狀態,會造成許多假象,只有在排除了地形影響后,才能作為預警指標,在目前情況下,只能作為預報的一個參考。氣壓場和總溫度能量場的分析對于地面層較為有效,尤其當氣壓場較弱時引進的氣壓擾動量,可發現擾動周期為1~2小時的中小尺度系統。總溫度能量場的引入綜合表示了溫度、氣壓、水汽各要素,分析總溫度能量場又可彌補分析溫度場受地形影響較大的不足,有利于了解氣團屬性的演變,與風場輻合區配合,將指示未來不穩定區的形成和加強,是最具有指示意義的特征量。但地面有效特征量偏少,今后還需提取更多有效特征量方能更好地作出后期預報產品。
10.3969/j.issn.1001-8972.2011.17.007