安徽理工大學計算機科學與工程學院 王三好
本文利用全球站點無線電高空探測資料數據集(the Integrated Global Radiosonde Archive,簡稱IGAR)獲取了北京市近42年來0-10km的溫度數據資料。并通過對所獲取的數據進行預處理,在保證數據的完整性和準確性的前提下,對北京市的年平均溫度數據采用線性擬合和Mann-Kendall突變檢驗等方法,進行溫度分析,發現北京市的年平均溫度整體呈現上升趨勢,且在2002年氣溫發生突增現象。
近年來,隨著信息社會的發展,高空大氣數據的獲取手段越來越多,數據量也越來越大;而且高空大氣數據參數多樣,且數據當中易參雜一些錯誤或者未收集的信息,因此大數據的數據處理方法在氣象數據的分析中得到了廣泛的應用(王星.大數據分析:方法與應用[M].清華大學出版社,2013;曾忠祿.大數據分析:方向、方法與工具[J].情報理論與實踐,2017,40(1):1-5;樊重俊,劉臣,霍良安.大數據分析與應用[M].立信會計出版社,2016.);而進行數據分析的前提首先要保證使用數據的準確性和完整性,常見的數據處理方法有數據清理、數據集成、數據變換和數據歸約等(王堯.基于大數據的數據處理方法研究分析[J].數字技術與應用,2014(6):98-98.)。本文在以IGAR(陳哲,高杰,楊旭.IGRA全球站點探空數據集及其資料質量狀況分析[J].氣象與環境學報,2013(5):106-111.)數據集為基礎,并使用大數據預處理方式,獲取了北京近42年來0-10km區域內高空的氣溫數據,然后又對北京市的年平均氣溫進行了細致分析,希望可以幫助人們了解北京市的氣溫變化。
本文利用IGAR高空探測資料獲取了北京從1956-2016年的氣溫數據,同時根據IGAR數據集的特點,將北京數據集當中的1956-1974年間的不完整和錯誤的數據進行了刪除,并對1956-2016年的數據進行再分析,最后獲取北京1975-2016年0時和12時的氣溫數據進行分析,并使用Excel、OrgrinPro 2017對數據進行線性分析,同時使用matlab對數據進行降噪處理,使用Mann-Kendall突變分析法對北京氣溫進行分析研究。
本文使用線性趨向分析和Mann-Kendall突變檢驗分析(簡稱M-K法)、等方法對北京市的溫度數據進行分析。其中M-K法是一種非參數統計檢驗方式,對變量是否具備正態分布并沒有具體要求,多用于氣候要素變化趨勢的顯著性檢驗及突變檢測,其公式如下:

式中采用:Zc—秩相關系數;τ—檢驗統計變量;P—數據序列所有對偶觀測值(Rj, Ri, j > i)中Rj> Ri出現的次數;n—序列長度;—方差。
圖1所示是1975-2016年北京市年均溫度的變化,從圖中可以看出,近42年來北京市年平均溫度-9.06℃;由線性趨勢分析可知,北京市從1975年以來的溫度呈現逐漸增加的趨勢,且線性擬合的相關程度值為0.734,具有高度相關性,再根據十年際溫度變化特征(如表1所示)結果可發現,從1975以來至今,10年際的平均溫度變化模式總體呈直線上升,最高的10年平均溫度分布區間在2005-2016年之間(-7.62℃),最低10年平均溫度分布區間在1985-1994年之間(-10.33℃);且由圖可知年平均最大值是在2007年溫度為-6.45℃,而年平均最小值是在1985年溫度為-11.55℃。

圖1 1975-2016年北京市年均溫度的變化

表1 北京市每十年的平均溫度變化

圖2 北京市年平均溫度變化的Mann-Kendall突變分析圖
圖2所示是北京市年平均溫度變化的Mann-Kendall突變分析圖,本文利用matlab對氣溫進行降噪處理,然后使用Mann-Kendall突變分析對降噪的氣溫數據進行突變檢驗,從圖中可以看出,北京市的年平均溫度在2002年時UF和UB相交,且在從1991-2016年北京市的平均溫度總體表現緩慢上升,因此其在2002年為氣溫突增點。
本文通過使用數據填充、篩選等數據預處理方法,在保證數據的完整性和準確性的前提下,獲取了北京市1975-2016年的年平均氣溫數據,同時通過對數據進行均一化和降噪處理,使用線性擬合和M-K突變檢驗等方法對獲取的數據進行分析,發現北京市的年平均溫度整體呈現上升趨勢,且年平均氣溫在2002年時溫度出現了突增。