摘 要:結合頻譜時間序列的特點,選擇ARIMA模型作為預測模型,通過ARIMA模型算法的流程分析,初步論證預測模型及預測精度的可靠性。
關鍵詞:ARIMA模型頻譜時間序列
中圖分類號:TM714文獻標識碼:A文章編號:1674-098X(2011)05(c)-0014-01
時間序列就是按時間順序取得的一系列觀測值,具有如下特點:首先,時間序列的數據或數據點的位置依賴于時間,即數據的取值依賴于時間的變化,但不一定是時間t的嚴格函數;其次,每一時刻上的取值或數據點的位置具有一定的隨機性,不可能完全準確地用歷史值進行預測;第三,前后時刻(不一定是相鄰時刻)的數值或數據點的位置有一定的相關性,這種相關性就是系統的動態規律性。
1 頻譜時間序列的特點
由于電磁環境的復雜多樣性以及許多未知因素和不確定因素的影響,頻譜占用是一個復雜多變的過程,頻譜數據具有高度的非線性特點。目前多數學者認為,頻譜時間序列一般由確定分量和隨機分量組成,確定分量具有一定的物理含義,隨機分量由不規則的振蕩和隨機影響造成,具有高度的非線性特點,在進行頻譜數據分析時,應根據頻譜時間序列的特點找出一種精度較高的預測模型。
2 基于ARIMA模型算法的流程分析
ARIMA模型算法分析流程圖如圖1所示。
2.1 平穩性檢驗
平穩時間序列因為有很好的統計特性,首先檢驗所觀測樣本的平穩性,然后根據其是否具有平穩性來建立相適應的模型,主要使用自相關系數和自相關圖檢驗。運用自相關分析圖判定時間序列平穩性的一般準則是:若時間序列的自相關系數基本上(通常為p>3時)都落入置信區間,且逐漸趨于零,則該時間序列具有平穩性;若時間序列的自相關系數更多的落在置信區間外面,則該時間序列就不具有平穩性。
2.2 純隨機性檢驗
如果序列值之間沒有任何相依性,過去的行為對將來的發展沒有任何絲毫影響,這種序列稱為純隨機序列。從統計的觀點來看,純隨機序列是沒有任何分析價值的序列,因此需要對平穩序列進行純隨機性檢驗。
如果時間序列滿足如下性質:
①任取t∈T,有
(7)
②任取t,s∈T,有
(8)
則稱序列為純隨機序列,也稱為白噪聲(White Noise)序列,簡記為 。
白噪聲序列的各項之間沒有任何相依性,沒有記憶能力,完全進行無序的隨機波動。如果序列值之間出現某種顯著的相依關系:
(9)
就說明該序列不是純隨機序列,該序列間隔k期的序列值之間存在著一定程度的相互影響關系,統計上稱為相關信息。分析的目的就是要想方設法把這種相關信息從觀測值序列中充分提取出來。一旦觀測值序列中蘊含的相關信息被充分提取出來了,那么剩下的殘差序列就應該呈現出純隨機的性質,所以純隨機性也是判斷相關信息是否被充分提取了的一個判斷標準。
另外,白噪聲序列的每個分量的方差都相等,也就是所謂方差齊性。在時間序列分析中,方差齊性是一個非常重要的限制條件。因為根據Markov定理,只有方差齊性假定成立時,我們用最小二乘法得到的未知參數估計值才是最佳的線性無偏估計。否則,最小二乘估計值就不是最佳的線性無偏估計,擬合模型的精度就會受很大的影響。所以在進行模型擬合時,就要檢查擬合模型的殘差是否滿足方差齊性假定。如果不滿足,那就說明殘差序列還不是白噪聲序列,即擬合模型還沒有充分提取隨機序列中的相關信息,這時就需要使用適當的條件異方模型來擬合該序列。
2.3 模型識別
ARMA模型的識別可以通過自相關系數、偏自相關系數圖進行。自相關系數描述的是時間序列觀測值與過去值之間的相關性。偏自相關系數(PACF,Partial Autocorrelation Function)則為在給定中間觀測值的條件下,觀測值與前面某個間隔的觀測值之間的相關系數。偏自相關系數的推導過程較為復雜,其實質是使殘差的方差達到最小的k階AR模型的第k項系數。
利用相關系數圖進行模型識別,還應該搞清楚截尾與拖尾的概念。所謂截尾,是指在相關系數圖或偏自相關系數圖中,自相關系數或偏自相關系數在滯后的前幾期處于置信區間之外,而滯后的系數基本上都落入置信區間內,且逐漸趨于零。通常把相關系數圖在滯后第p期后截尾的情況叫做p階截尾。所謂拖尾,是指在自相關系數圖或偏自相關系數圖中的系數有指數型、正弦型或震蕩型衰減的波動,并不會都落入置信區間內。利用自相關系數圖或偏自相關系數圖進行模型識別,主要依靠以下原則,如表1所示。
2.4 求預測效果
在建立ARIMA模型的基礎上對頻譜監測數據進行多步預測,并引入統計量均方根誤差(RMSE)和正歸化均方根誤差(NRMSE)來評價模型的預測效果。
(17)
(18)
式中,,分別為實測值和預測值,為實測值的標準差,為預測步數。RMSE、NRMSE的值越小說明預測結果越好。