王亞男 雷英杰 王 毅 鄭寇全
?
一種啟發式變階直覺模糊時間序列預測模型
王亞男*①雷英杰①王 毅①鄭寇全②
①(空軍工程大學防空反導學院 西安 710051)②(西安通信學院 西安 710106)
論文針對已有高階模糊時間序列模型在預測精度和預測范圍上的限制,結合直覺模糊集理論,提出一種啟發式變階直覺模糊時間序列預測模型。模型首先應用直接模糊聚類算法對論域進行非等分劃分;然后,針對直覺模糊時間序列的數據特性,改進現有直覺模糊集隸屬度和非隸屬度函數的建立方法;最后,采用階數隨序列實時變化的高階預測規則進行預測,并將歷史數據發展趨勢的啟發知識引入解模糊過程,使模型的預測范圍得到擴展。在Alabama大學入學人數和北京市日均氣溫兩組數據集上分別與典型方法進行對比實驗,結果表明該模型有效克服了傳統模型的缺點,擁有較高的預測精度,證明了模型的有效性和優越性。
直覺模糊集;時間序列預測;啟發式;變階
模糊時間序列(Fuzzy Time Series, FTS)預測理論由文獻[1-3]在1993年首次提出并應用于Alabama大學招生人數預測,取得了較好的預測效果。進而該理論在預測領域得到了廣泛研究與發展,尤其在不精確數據或模糊數據等問題中預測效果優良,例如城市用電負荷預測[4]、股指交易量預測[5]、景點游客量預測[6]等。對FTS預測模型的改良主要集中在4個方面:論域的劃分;模糊關系和預測規則的建立;多元模型;高階模型。FTS模型中對歷史數據模糊化時采用了傳統的Zadeh模糊集概念,與直覺模糊集相比,對語言值隸屬性質的度量既不夠客觀也不夠全面,這從根本上限制了預測精度的提升。而直覺模糊時間序列(Intuitionistic Fuzzy Time Series, IFTS)預測模型將直覺模糊集理論引入FTS模型,極大地擴展了時間序列對不確定、不完備等模糊信息的處理能力,有效提升了FTS模型的預測效果。
文獻[19,21]相繼提出了多種高階FTS模型,但這些模型都有一個共同的特點:模型的階數固定,即雖然模型可以取不同的階數,但當階數取定后,在整個預測過程中都不能改變。我們將這種模型叫做“定階模型”。對定階模型的實驗結果進行分析發現,它們存在一個缺陷:每個歷史數據的最優預測值對應的模型階數并不相同,即無論模型取何種階數,得到的預測效果都不是最優的。此外,傳統FTS和IFTS模型存在一個共同的缺陷:預測范圍固定,即預測值始終位于由歷史數據確定的論域之中,這就使得模型永遠無法得到歷史數據范圍之外的預測值。這種缺陷嚴重影響了模型的預測精度。
鑒于以上分析,本文結合直覺模糊集理論,對階數可變的高階模型進行研究,同時通過對歷史數據發展趨勢的分析,將趨勢先驗知識引入模型,建立了一個啟發式變階IFTS預測模型。對比實驗證明所建模型有效克服了傳統模型的缺陷,使預測更貼近實際需求,取得了較好的效果。
定義1[27]設是一給定論域,則上的一個直覺模糊集為





IFTS預測模型可以概括為4個主要步驟:(1)確定論域大小,并對論域進行劃分;(2)建立直覺模糊集,將歷史數據直覺模糊化;(3)確定預測規則,求得預測值;(4)預測結果去模糊化輸出。本節首先介紹論域劃分和直覺模糊集的建立方法,然后給出模型的完整步驟。
3.1基于模糊聚類的非等分論域劃分
文獻[7]的研究已表明,在FTS模型中使用非等分劃分方法會產生比等分方法更好的預測結果。本文采取較遺傳算法等優化算法更簡捷的基于最大生成樹的直接模糊聚類算法[27]。設是待分類對象的全體,聚類得到的類數據可記為其中,,,,表示第類數據所含對象個數。記

3.2建立直覺模糊集

3.3模型步驟
為了使預測過程更符合實際需求,首先需要建立以下3條規則:

表1 模型中的變量及含義
步驟1 確定模型的初始階數。由于在實際計算中,模型階數過高會帶來很大的計算量[19,20],因此為保證模型的實時性,本文限制模型的階數最大取9。算法1(表2)以序列初始的10個歷史數據為訓練數據集來確定模型的初始階數,即當模型階數依次取時,分別用預測,選取其中預測誤差最小的階數作為。
表2確定初始階數算法

算法1 確定初始階數輸入:輸出:(1) (2) (3) for to 9(4) 按步驟2 -步驟9計算(5) (6) if(7) (8) (9) end if(10) end for(11) (12) return
步驟5 直覺模糊化歷史數據差值。計算所有歷史數據對每個直覺模糊集的隸屬度、非隸屬度和直覺指數,歷史數據的直覺模糊化值可以用以一對向量表示。





對標準向量和操作矩陣進行運算,得到一對關系矩陣:
表3尋找最優預測階數算法

算法2 尋找最優預測階數輸入:輸出:(1) (2) (3) (4) if(5) for to 9(6) (7) while (8) 按步驟7-步驟 9計算(9) (10) if(11) (12) break(13) end if(14) end while(15) end for(16) while(17) for to 9(18) (19) while (20) 按步驟7-步驟9計算(21) (22) if(23) (24) break(25) end if(26) end while(27) end for(28) end while(29) end if(30) return





其中,

步驟9 預測結果去直覺模糊化。將式(16)中的最大值個數記為,每個最大值對應的直覺模糊集和區間分別記為和,。將趨勢先驗知識作用到上,得到新的區間為
4.1 Alabama大學入學人數實驗
Alabama大學入學人數數據集是文獻[2]首次提出FTS模型時使用的一組實驗數據,此后該數據集常作為FTS和IFTS模型的測試集,用以檢驗模型的可行性。將本文的IFTS模型應用在該數據集上,得到各年入學人數預測結果如表4所示。
將文獻[2],文獻[9],文獻[19],文獻[24],文獻[26]的模型分別應用在Alabama大學入學人數數據集上,利用均方誤差(Root Mean Square Error, RMSE)和平均預測誤差(Average Forecasting Error, AFE)兩項指標將本文的預測結果同其它5種模型的預測結果進行比較。兩項指標的計算為


表5列出了各模型的預測結果和預測性能及算法復雜度。其中,文獻[2]為傳統FTS模型,文獻[11]和文獻[20]為啟發式FTS模型,文獻[24]和文獻[26]為傳統IFTS模型。在文獻[19]和文獻[26]中,不同的取值對應了不同的預測結果,本文選取其中的最優結果用于比較。代表算法中(直覺)模糊邏輯關系個數,代表歷史數據個數,代表(直覺)模糊邏輯關系組個數,代表窗口長度或算法的階數。
從表5可以看出,與傳統模型(即文獻[2],文獻[24]和文獻[26])相比,本文模型擴展了預測值的取值范圍,而不是僅僅局限于歷史數據范圍內。例如,當預測1990年的數據時,歷史數據的取值范圍是[13000, 19000],而1990年的數據為19328,不在歷史數據范圍內。文獻[2],文獻[24]和文獻[26]的預測值分別為19000, 18961和19000,由于模型算法的制約它們的預測值始終只能位于區間[13000, 19000]內。而本文模型的預測值為19600,沒有受到歷史數據取值范圍的制約。結合表4和表5的結果可以看出,與啟發式模型(即文獻[10]和文獻[19])相比,本文模型的預測階數不是固定不變的,而是通過階數的自適應變化使每一年的預測數據都盡可能接近真實數據,從而得到了更小的平均預測誤差。從時間復雜度上看,本文模型的時間復雜度較其它模型相比雖有一定增加,但依然控制在()數量級內,相較其預測結果的提升,這種程度的復雜度犧牲是可以接受的。與其它5種模型相比,本文模型的預測結果有所提升,從而證明該模型不僅是可行的而且預測結果是優良的。

表4 Alabama大學入學人數預測值
表5各模型對Alabama大學入學人數的預測性能

年份真實值預測值 文獻[2]模型文獻[10]模型文獻[19]模型文獻[24]模型文獻[26]模型本文模型 197113055–––––– 1972135631400014279–14250–– 1973138671400014279–14246–– 1974146961400014279–14246–– 1975154601550015392–15491–– 1976153111600015392–1549115451– 1977156031600015392–1549115530– 1978158611600016467–1634516002– 1979168071600016467–1634516750– 1980169191681317161–1585017321– 198116388168131716116919158501701216986 198215433167891491616188158501622315830 198315497160001539214833154501556015693 198415145160001539215497154501511215329 198515163160001539214745154911511215201 198615984160001547015163154911556415394 198716859160001646716784163451615016780 198818150168131716117659179501742017674 198918970190001925719150189611863419308 199019328190001925719770189611900019600 199119337190001925719728189611957819733 199218876190001925719337189611963019321 RMSE635440508433439377 AFE(%)3.102.282.792.242.031.94 T(n)
4.2 日均氣溫數據集實驗
北京市日均氣溫數據集是由中國氣象信息中心提供的以天為單位對北京市氣溫進行的統計,本文只選取從2014年6月1日至2014年7月1日的數據作為實驗數據集,如表6所示。
在該數據集上應用文獻[2],文獻[19],文獻[24],文獻[26]中的模型及本文模型進行預測,預測值及實際值如圖1所示。
各模型預測性能的對比如表7所示。由表7可以看出,本文所建IFTS模型能夠有效預測通用數據集中的數據,預測效果較現有模型有了較大提升。

表6 2014.6.1-2014.7.1北京市日均氣溫(℃)
表7各模型對日均氣溫數據集的預測性能

指標文獻[2]模型文獻[19]模型文獻[24]模型文獻[26]模型本文模型 RMSE1.701.531.291.191.00 AFE(%)5.304.593.923.513.35

圖1 各模型對日均氣溫數據集的預測值
本文針對傳統模糊時間序列預測模型的不足,利用直覺模糊集理論在處理不確定數據上的優勢,建立了一個啟發式變階直覺模糊時間序列模型。采用階數可變的高階模型建立預測規則,實時地根據序列數據的發展趨勢改變模型的階數,使得每一次預測都盡可能地接近實際值,從而提升模型的整體預測精度。同時在解模糊階段,從歷史數據中得到數據發展趨勢的啟發知識,利用其擴展或縮小模型的預測范圍,使得模型的預測值不受論域的束縛,更加準確。在兩類數據集上與經典算法的對比試驗表明模型具有較好的預測性能。但是模型依然存在幾點缺陷,需要后續繼續研究解決:(1)算法1的模型階次選擇是在一個較小的范圍內尋優的,如果不加范圍限制,怎樣解決算法的收斂問題?(2)如何克服模型中可能存在過擬合的問題?此外,如何建立多元變階直覺模糊時間序列,進一步提高預測性能,也將是下一步研究的重點。
[1] SONG Q and CHISSOM B S. Fuzzy time series and its models[J]., 1993, 54(1): 269-277. doi: 10.1016/0165-0114(93)90372-O.
[2] SONG Q and CHISSOM B S. Forecasting enrollments with fuzzy time series-Part I[J]., 1993, 54(1): 1-9. doi: 10.1016/0165-0114(93)90355-L.
[3] SONG Q and CHISSOM B S. Forecasting enrollments with fuzzy time seriesPart II[J]., 1994, 62(1): 1-8. doi: 10.1016/0165-0114(94)90067-1.
[4] EFENDI R, ISMAIL Z, and DERIS M M. A new linguistic out-sample approach of fuzzy time series for daily forecasting of Malaysian electricity load demand[J]., 2015, 28(3): 422-430. doi: 10.1016/j.asoc.2014.11.043.
[5] SUN Baiqing, GUO Haifeng, KARIMI H R,. Prediction of stock index futures prices based on fuzzy sets and multivariate fuzzy time series[J]., 2015, 151(3): 1528-1536. doi: 10.1016/j.neucom.2014.09.018.
[6] TSAUR R C and KUO T C. Tourism demand forecasting using a novel high-precision fuzzy time series model[J].,, 2014, 10(2): 695-701.
[7] HUANG K and YU T H-K. Ratio-based lengths of intervals to improve fuzzy time series forecasting[J].,,:, 2006, 36(2): 328-340.doi: 10.1109/TSMCB.2005.857093.
[8] CAI Qisen, ZHANG Defu, ZHENG Wei,. A new fuzzy time series forecasting model combined with ant colony optimization and auto-regression[J]., 2015, 74(1): 61-68. doi: 10.1016/j.knosys.2014.11.003.
[9] IZAKIAN H, PEDRYCZ W, and JAMAL I. Fuzzy clustering of time series data using dynamic time warping distance[J]., 2015, 39(3): 235-244. doi: 10.1016/j.engappai.2014.12.015.
[10] LU Wei, CHEN Xueyan, PEDRYCZ W,. Using interval information granules to improve forecasting in fuzzy time series[J]., 2015, 57(2): 1-18. doi: 10.1016/j.ijar.2014.11.002.
[11] ABDOLLAHZADE M, MIRANIAN A, HASSANI H,. A new hybrid enhanced local linear neuro-fuzzy model basedon the optimized singular spectrum analysis and its applicationfor nonlinear and chaotic time series forecasting[J]., 2015, 295(2): 107-125. doi: 10.1016/ j.ins.2014.09.002.
[12] CHENG S H, CHEN S M, and JIAN W S. Fuzzy time series forecasting based on fuzzy logical relationships and similarity measures[J]., 2016, 327(1): 272-287. doi: 10.1016/j.ins.2015.08.024.
[13] PENG Hungwen, WU Shenfu, WEI Chiaching,. Time series forecasting with a neuro-fuzzy modeling scheme[J].,2015, 32(7): 481-493. doi: 10.1016/ j.asoc.2015.03.059.
[14] CHEN M Y and CHEN B T. Online fuzzy time series analysis based on entropy discretization and a fast Fourier transform[J]., 2014, 14(1): 156-166. doi: 10.1016/j.asoc.2013.07.024.
[15] DENG W, WANG G, and ZHANG X. A novel hybrid water quality time series prediction method based on cloud model and fuzzy forecasting[J]., 2015, 149(12): 39-49. doi: 10.1016/ j.chemolab.2015.09.017.
[16] PEREIRA C M, ALMEIDA N N, and VELLOSO M. Fuzzy modeling to forecast an electric load time series[J]., 2015, 55: 395-404. doi: 10.1016/j.procs. 2015.07.089.
[17] SINGH P and BORAH B. Forecasting stock index price based on M-factors fuzzy time series and particle swarm optimization[J]., 2014, 55(3): 812-833. doi: 10.1016/j.ijar.2013. 09.014.
[18] CHEN S M and CHEN S W. Fuzzy forecasting based on two-factor second-order fuzzy-trend logical relationship groups and the probabilities of trends of fuzzy logical relationships[J]., 2015, 45(3): 405-417.doi: 10.1109/TCYB.2014.2326888.
[19] HWANG J R, CHEN S M, and LEE C H. Handling forecasting problems using fuzzy time series[J]., 1998, 100(1): 217-228. doi: 10.1016/S0165-0114(97)00121-8.
[20] LIU Haotien and WEI Maolen. An improved fuzzy forecasting method for seasonal time series[J]., 2010, 37(9): 6310-6318. doi: 10.1016/ j.eswa.2010.02.090.
[21] SINGH P and BORACH B. High-order fuzzy-neuro expert system for time series forecasting[J]., 2013, 46(7): 12-21. doi: 10.1016/j.knosys.2013. 01.030.
[22] ASKARI S and MONTAZERIN N. A high-order multi-variable fuzzy time series forecasting algorithm based on fuzzy clustering[J]., 2015, 42(4): 2121-2135. doi: 10.1016/j.eswa.2014.09.036.
[23] CASTILLO O, ALANIS A, GARCIA M,. An intuitionistic fuzzy system for time series analysis in plant monitoring and diagnosis[J]., 2007, 7(4): 1227-1233. doi: 10.1016/j.asoc.2006.01.010.
[24] JOSHI B P and KUMAR S. Intuitionistic fuzzy sets based method for fuzzy time series forecasting[J]., 2012, 43(1): 34-47.doi: 10.1080/01969722.2012.637014.
[25] 鄭寇全, 雷英杰, 王睿, 等. 直覺模糊時間序列建模及應用[J]. 控制與決策, 2013, 28(10): 1525-1530.
ZHENG Kouquan, LEI Yingjie, WANG Rui,. Modeling and application of IFTS[J]., 2013, 28(10): 1525-1530.
[26] 鄭寇全, 雷英杰, 王睿, 等.參數自適應的長期IFTS預測算法[J]. 系統工程與電子技術, 2014, 36(1): 99-104. doi: 10.3969/ j.issn.1001-506X.2014.01.16.
ZHENG Kouquan, LEI Yingjie, WANG Rui,. Method of long-term IFTS forecasting based on parameter adaption[J]., 2014, 36(1): 99-104. doi: 10.3969/j.issn.1001-506X.2014.01.16.
[27] 梁保松, 曹殿立. 模糊數學極其應用[M]. 北京: 科學出版社, 2007: 65-85.
LIANG Baosong and CAO Dianli. Fuzzy Mathematics and Applications[M]. Beijing: Science Press, 2007: 65-85.
[28] 雷英杰, 趙杰, 路艷麗, 等. 直覺模糊集理論及應用[M]. 北京: 科學出版社, 2014: 28-189.
LEI Yingjie, ZHAO Jie, LU Yanli,. Theories and Applications of Intuitionistic Fuzzy Set[M]. Beijing: Science Press, 2014: 28-189.
[29] WANG Yanan, LEI Yingjie, FAN Xiaoshi,. Intuitionistic fuzzy time series forecasting model based on intuitionistic fuzzy reasoning[J]., 2016(2016): 1-12. doi: 10.1155/2016/5035160.
A Heuristic Adaptive-order Intuitionistic Fuzzy Time Series Forecasting Model
WANG Yanan①LEI Yingjie①WANG Yi①ZHENG Kouquan②
①(,,’710051,)②(’,’710106,)
Considering that the existing high-order models have limitations in forecast range and accuracy, a heuristic adaptive-order intuitionistic fuzzy time series forecasting model is built with the combination of the intuitionistic fuzzy sets theory. In this model, a direct fuzzy clustering algorithm is used to partition the universe of discourse into unequal intervals. The traditional method of ascertaining the membership and non-membership functions of intuitionistic fuzzy set are also modified to fit the intuitionistic fuzzy time series data. On these basis, variable high-order forecasting rules are established and the prior knowledge of tendency is used in defuzzification to extend the forecasting range. At last, contrast experiments on the enrollments of the University of Alabama and the daily average temperature of Beijing are carried out. The results show that the new model has a clear advantage of improving the forecast accuracy.
Intuitionistic fuzzy set; Time series forecast; Heuristic; Adaptive order
TP391
A
1009-5896(2016)11-2795-08
10.11999/JEIT160013
2016-01-04;改回日期:2016-05-26;
2016-07-19
王亞男 wyn1988814@163.com
國家自然科學青年基金項目(61402517)
The National Natural Science Foundation of China (61402517)
王亞男: 女,1988年生,博士生,研究方向為網絡信息安全.
雷英杰: 男,1956年生,教授,博士生導師,研究方向為網絡信息安全、智能信息處理.
王 毅: 男,1979年生,講師,博士,研究方向為智能信息處理.
鄭寇全: 男,1983年生,講師,博士,研究方向為智能信息處理.