程亮,劉家峻,劉科峰,余丹丹,余運(yùn)河
(1.中國(guó)人民解放軍61741部隊(duì),北京市 100081;2.解放軍理工大學(xué)氣象學(xué)院,江蘇省 南京 211101)
基于小波分解和最小二乘支持向量機(jī)的ENSO集成預(yù)測(cè)
程亮1,劉家峻1,劉科峰2,余丹丹1,余運(yùn)河1
(1.中國(guó)人民解放軍61741部隊(duì),北京市 100081;2.解放軍理工大學(xué)氣象學(xué)院,江蘇省 南京 211101)
用小波分解和最小二乘支持向量機(jī)相結(jié)合的方法,建立了 ENSO的集成預(yù)報(bào)模型。該方法將復(fù)雜海溫系統(tǒng)分解為相對(duì)簡(jiǎn)單的帶通分量信號(hào),然后建立分量信號(hào)的獨(dú)立預(yù)報(bào)模型,最后對(duì)預(yù)報(bào)結(jié)果進(jìn)行集成。試驗(yàn)結(jié)果表明,模型在保留預(yù)報(bào)對(duì)象主要特征的前提下,有效地降低了預(yù)報(bào)難度,集成預(yù)報(bào)準(zhǔn)確率和預(yù)報(bào)時(shí)效均較傳統(tǒng)方法有明顯的改進(jìn)和提高。
小波分解;最小二乘支持向量機(jī);赤道海溫
Abstract:Using the method of combining wavelet decomposition and least squares support vector machine,the integration prediction model of ENSO is established.With this method,the SST system is decomposed into a relatively simple band-pass component signals,then an independent forecasting model of component signals is set up,and the prediction results are integrated.The results show that while retaining the main features of the predicted objects,the model effectively reduces the difficulty of forecasting; integrated forecasting accuracy and forecasting timeliness are significantly improved and enhanced than that of the traditional methods.
Keywords:wavelet decomposition; least squares support vector machines; equatorial sea surface temperature
ENSO是目前為止唯一已經(jīng)確認(rèn)的真實(shí)的全球尺度振蕩,也是迄今為止人類所觀測(cè)到的全球大氣和海洋相互耦合的最強(qiáng)信號(hào)之一。ENSO的發(fā)生將會(huì)對(duì)世界許多地區(qū)的氣候產(chǎn)生重大影響,是引起全球大氣環(huán)流和水分循環(huán)異常的重要原因,因此,近20年來 ENSO研究一直是短期氣候變化方面的一個(gè)研究焦點(diǎn)[1-4]。ENSO實(shí)際上由兩個(gè)分量組成,第一個(gè)分量(主要對(duì)海洋)稱為El Ni?o,第二個(gè)分量(主要對(duì)大氣)是指南方濤動(dòng)(SO: Southern Oscillation)。60 年代中期 Bjerknes的一系列經(jīng)典著作推進(jìn)了大氣與海洋相互作用的研究,他提出 El Ni?o和SO事實(shí)上是熱帶太平洋大尺度海氣相互作用同一現(xiàn)象的兩個(gè)方面。另一方面,Philander 也提出 El Ni?o 和 La Ni?a 也是互補(bǔ)的,由暖的 El Ni?o位相和冷的La Ni?a位相組成一個(gè)南方濤動(dòng)循環(huán)[5]。目前,多數(shù)學(xué)者使用赤道東太平洋的海溫距平來表示 El Ni?o 的 發(fā) 生,把 Ni?o3 區(qū)( 5°N~5°S,150°W~90°W)的 SST距平連續(xù) 3個(gè)月大于 0.5℃為El Ni?o爆發(fā)的標(biāo)準(zhǔn)。南方濤動(dòng)通常用南方濤動(dòng)指數(shù)(SOI,定義為Darwin與Tahiti間的海面氣壓差)表示[6]。
以El Ni?o/La Ni?a為顯著特征的赤道東太平洋海溫是復(fù)雜的非線性系統(tǒng),El Ni?o/La Ni?a的發(fā)生發(fā)展機(jī)制和影響制約因子及動(dòng)力作用過程目前尚未徹底弄清,因此對(duì)它的準(zhǔn)確預(yù)測(cè)仍是一項(xiàng)十分復(fù)雜和困難的工作。鑒于Ni?o3區(qū)海溫和南方濤動(dòng)指數(shù)的密切相關(guān)性,我們選用超前的Ni?o3區(qū)海溫和南方濤動(dòng)指數(shù)作為預(yù)報(bào)因子,采用小波分解與最小二乘支持向量機(jī)相結(jié)合的方法,外推預(yù)測(cè)其后的海溫狀況。
分析資料為美國(guó)國(guó)家環(huán)境預(yù)報(bào)中心 NCEP(National Center for Environment Prediction)和美國(guó)國(guó)家大氣研究中心 NCAR (National Center for Atmospheric Research)及美國(guó)綜合海洋大氣資料集COADS (Compositive Ocean and Atmosphere Data Sets)提供的 1958.1-1995.10共 454個(gè)月的 Nino3區(qū) 5oS-5oN,150oW-90oW 范圍海溫月平均距平時(shí)間序列。(該區(qū)域海溫常被用于表示El Ni?o/La Ni?a的發(fā)生發(fā)展。
支持向量機(jī)(Support vector machine.SVM)方法是近年國(guó)際上開始流行的一種新穎的處理非線性分類和回歸的有效方法。它以Vapnik提出的統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ),將樣本空間映射到一個(gè)更高維以至于無窮維的特征空間,在特征空間中把尋求最優(yōu)回歸超平面問題歸結(jié)為一個(gè)凸約束條件下的二次凸規(guī)劃問題,從而求得全局最優(yōu)解。Suykens等[6]提出的最小二乘支持向量機(jī)是支持向量機(jī)的一種,它是將標(biāo)準(zhǔn)支持向量機(jī)算法中的不等式約束轉(zhuǎn)化為等式約束而得到的。對(duì)非線性回歸問題,設(shè)訓(xùn)練樣本為。非線性回歸函數(shù)為:

對(duì)于最小二乘支持向量機(jī),優(yōu)化問題變?yōu)?/p>

求解式(5)的優(yōu)化問題,可以引入Lagrange函數(shù)

式中,ai為L(zhǎng)agrange乘子;常數(shù) >0,它控制對(duì)超出誤差的樣本的懲罰程度。最優(yōu)的ai和b可以根據(jù)KKT(Karush-Kuhn-Tuchker)條件得到

由式(2),優(yōu)化問題轉(zhuǎn)化為求解如下的線性方程


最常用的核函數(shù)有多項(xiàng)式核函數(shù)、RBF核函數(shù)、Sigmod核函數(shù)等。
1988年S.Mallat在構(gòu)造正交小波基時(shí)提出多分辨分析(Multi-Resolution Analysis)概念,從空間的概念上形象地說明了小波的多分辨率特性,給出了正交小波的構(gòu)造方法以及正交小波變換的快速算法,即Mallat算法。對(duì)多分辨率的理解,可從一個(gè)3層分解結(jié)構(gòu)說明,其小波分解樹如圖3。小波分解的最終目的旨在構(gòu)造一個(gè)在頻率上高度逼近原始信號(hào)的正交小波基,這些頻率分辨率不同的正交小波基相當(dāng)于帶寬各異的帶通濾波器[11]。從圖3可以看出,小波變換的多分辨分析主要對(duì)信號(hào)的低頻空間作細(xì)致的分解,使其低頻部分的分辨水平越來越高。分解重構(gòu)關(guān)系為:。若要作進(jìn)一步分解可繼續(xù)將低頻部份a3分解為低頻a4和高頻d4,以此類推。

圖1 小波頻率分解結(jié)構(gòu)Fig.1 Frequency structure of wavelet decomposition
Ni?o3區(qū)海溫可看作一個(gè)復(fù)雜的信號(hào),利用小波分解能夠?qū)?fù)雜信號(hào)進(jìn)行頻率(周期)分離的特性,將Ni?o3區(qū)海溫序列分解為相對(duì)簡(jiǎn)單的低頻信號(hào)和高頻信號(hào),然后,用最小二乘支持向量機(jī)分別對(duì)低頻信號(hào)和高頻信號(hào)建立預(yù)測(cè)模型。最后將預(yù)測(cè)得到的各頻段信號(hào)進(jìn)行重構(gòu),即可得到最終預(yù)測(cè)值。
采用最小二乘支持向量機(jī)對(duì)Ni?o3區(qū)海溫進(jìn)行預(yù)測(cè),其預(yù)測(cè)步驟如下:
a)考慮到分解重構(gòu)會(huì)引起累積誤差,因此分解水平不宜過高。本文用 sym5小波基對(duì)sst進(jìn)行 5層分解,分別提取 1~5層的高、低頻系數(shù),然后對(duì)各層高、低頻系數(shù)進(jìn)行重構(gòu),得到各頻帶的信號(hào)序列。實(shí)際副高面積指數(shù)變化可通過上述 1~5層高頻和第 5層低頻的重構(gòu)信號(hào)之和可以精確地獲得。
b)分別建立1~5層高頻和第5層低頻共5個(gè)頻段信號(hào)各自的LS-SVM預(yù)測(cè)模型,即利用超前3,4,5個(gè)月的海溫預(yù)測(cè)第6個(gè)月的海溫值。設(shè)P,T分別為SVM模型的預(yù)報(bào)因子輸入和預(yù)報(bào)結(jié)果輸出序列。即:

則每一時(shí)次的訓(xùn)練數(shù)據(jù)對(duì)為

c)分別將每個(gè)頻段的獨(dú)立檢驗(yàn)樣本、模型參數(shù)代入到對(duì)應(yīng)的每個(gè)模型,可得各頻段的預(yù)測(cè)信號(hào),重構(gòu)各頻段的預(yù)測(cè)信號(hào),并對(duì)重構(gòu)后的信號(hào)反歸一化,即可得預(yù)測(cè)的海溫值。
為檢驗(yàn)最小二乘支持向量機(jī)模型的獨(dú)立預(yù)報(bào)效果,將454個(gè)月的樣本分為兩部分,第一部分取前355個(gè)月,用于模型的建立和測(cè)試,在建立模型的過程中,采用k-折交叉檢驗(yàn)的方法,其基本思想是把l個(gè)樣本點(diǎn)隨機(jī)地分成k個(gè)互不相等的子集,即k-折。每個(gè)折的大小大致相等,共進(jìn)行k次訓(xùn)練與測(cè)試,即對(duì)進(jìn)行k次迭代,第i次迭代的做法是,選擇Si為測(cè)試集,其余的合集為訓(xùn)練集。本文取k=10。第二部分為后 89候,用于模型的獨(dú)立檢驗(yàn)和預(yù)報(bào)優(yōu)化效果的評(píng)估。該部分資料不參與模型的建立。

圖2 觀測(cè)值和預(yù)測(cè)值比較圖Fig.2 Comparison of observed values and predicted values
各頻域分量的LS-SVM模型集成結(jié)果均比較準(zhǔn)確的逼近實(shí)際信號(hào)(相關(guān)系數(shù)分別為0.9261,置信度,在總體趨勢(shì)上和局部細(xì)節(jié)上均很好的逼近了實(shí)際信號(hào)。尤其是對(duì)海溫的幾次異常變化的預(yù)測(cè)均比較準(zhǔn)確。
神經(jīng)網(wǎng)絡(luò)和線性回歸方法是氣象資料分析和要素預(yù)測(cè)中的常用的方法,為了評(píng)估和比較最小二乘支持向量機(jī)模型的預(yù)報(bào)效果和技術(shù)優(yōu)勢(shì),我們采用同樣的數(shù)據(jù)資料,分別建立了Ni?o3區(qū)海溫的神經(jīng)網(wǎng)絡(luò)、并與WT~LS-SVM模型的輸出結(jié)果進(jìn)行對(duì)比。表1為兩種預(yù)報(bào)模型獨(dú)立檢驗(yàn)結(jié)果與Ni?o3區(qū)海溫的相關(guān)系數(shù)。從表1的可以看出,最小二乘支持向量機(jī)模型的獨(dú)立檢驗(yàn)的相關(guān)系數(shù)均高于神經(jīng)網(wǎng)絡(luò)。上述的對(duì)比試驗(yàn)結(jié)果表明,本文所采用的小波分解和最小二乘支持向量機(jī)相結(jié)合的方法對(duì)Ni?o3區(qū)海溫預(yù)報(bào)對(duì)象的把握和描述較前面較神經(jīng)網(wǎng)絡(luò)和線性回歸模型更為恰當(dāng)和準(zhǔn)確,表現(xiàn)出較好的預(yù)報(bào)效果和技術(shù)優(yōu)勢(shì)。

表1 不同模型預(yù)報(bào)結(jié)果與實(shí)際值相關(guān)系數(shù)Tab.1 Correlation coefficient of predicted results by different models and the actual value
本文首先引入小波分解和最小二乘支持向量機(jī)模型相結(jié)合的集成預(yù)報(bào)方法用于Ni?o3區(qū)海溫及El Ni?o/La Ni?a的預(yù)測(cè)研究。該方法在保留預(yù)報(bào)對(duì)象主要特征的同時(shí),有效地降低了問題的復(fù)雜性,因而顯著提高了預(yù)報(bào)準(zhǔn)確率。由于小波方法能夠準(zhǔn)確分解和重構(gòu)帶通、低通信號(hào),其頻域-時(shí)域分辨率能夠自由伸縮,因此利于簡(jiǎn)化系統(tǒng)、提取特征,而模糊系統(tǒng)及 ANFIS模型具有高度的非線性、容錯(cuò)性、自適應(yīng)性和聯(lián)想學(xué)習(xí)功能。因此在研究和預(yù)測(cè)Ni?o3區(qū)海溫等復(fù)雜現(xiàn)象時(shí),上述方法具有明顯的優(yōu)越性。
試驗(yàn)結(jié)果表明,用小波分解重構(gòu)與最小二乘支持向量機(jī)相結(jié)合的方法來逼近和預(yù)測(cè)赤道東太平洋海溫及El Ni?o/La Ni?a事件,理論上合理、技術(shù)上可行,預(yù)報(bào)效果優(yōu)于常規(guī)的預(yù)報(bào)方法,預(yù)報(bào)結(jié)果有參考應(yīng)用意義。
[1]何金海,宇婧婧,沈新勇,等.有關(guān)東亞季風(fēng)的形成及其變率的研究 [J].熱帶氣象學(xué)報(bào),2004,20(5): 449-459.
[2]Pan Y H,Oort A.Global climate variations connecled with sea surface temperature anomalies in the eastern equatorial Pacific Ocean for the 1958~73 period [J].Mon Wea Rev.1983,111(6): 1 244-1 258.
[3]陳海山,孫照渤,倪東鴻.Ni?o C區(qū)秋季海溫異常對(duì)東亞冬季大氣環(huán)流的影響 [J].熱帶氣象學(xué)報(bào),2002,18(2): 148-156.
[4]鄒力,吳愛明,倪允琪.在準(zhǔn)兩年尺度上ENSO與亞洲季風(fēng)相互作用的研究 [J].熱帶氣象學(xué)報(bào),2002,18(1): 19-28.
[5]劉科峰,張韌,余鵬,等.基于小波分解和最小二乘支持向量機(jī)的西太平洋副高預(yù)測(cè)模型 [J].熱帶氣象學(xué)報(bào),2007,23(5):491-496.
[6]趙其庚.海洋環(huán)流及海氣耦合系統(tǒng)的數(shù)值模擬 [M].北京: 氣象出版社,1999,179-182.
[7]Bart Kosko.模糊工程(黃崇福譯)[M].西安: 西安交通大學(xué)出版社,1999.
[8]李士勇.模糊控制.神經(jīng)控制和智能控制論 [M].哈爾濱: 哈爾濱工業(yè)大學(xué)出版社,1998.
[9]Roger Jang J S,Sun C T,Mizutani E.Neuro-Fuzzy and soft computing: A computational approach to learning and machine intelligence [M].Prentice-Hall,Inc,1997.
[10]T Takagi,M Sugeon.Fuzzy identification and its application to modeling and Control [J].IEEE SMC.15(1),116-132,1985.
[11]胡昌華.基于Matlab的系統(tǒng)分析與設(shè)計(jì)-小波分析 [M].西安:西安電子科技大學(xué)出版社,1999.
[12]李崇銀.氣候動(dòng)力學(xué)引論 [M].北京: 氣象出版社,1995.
ENSO integration prediction based on wavelet decomposition and least squares support vector machine
CHENG Liang1,LIU Jia-jun1,LIU Ke-feng2,YU Dan-dan1,YU Yun-he1
(1.61741 Army Force of PLA,Beijing 100081; 2.Institute of Meteorology,PLA Univ.of Sci.& Tech.,Nanjing 211101,China)
P732
A
1001-6932(2010)04-0367-05
2009-09-18;
2009-12-21
程亮(1981-),男,博士,工程師,主要從事氣象水文研究。電子信箱:by_chengliang@yahoo.com.cn