張潔 張玉 董小剛



摘要: 針對有上限且數據之間具有相依結構的非線性整數值時間序列數據的建模問題,提出一個自激勵廣義二項門限自回歸模型. 首先,證明該模型的嚴平穩遍歷性,并討論模型的一些統計性質: 期望、 方差、 自協方差和轉移概率; 其次,分別給出門限變量在已知和未知兩種情形下模型參數的條件最大似然估計方法; 最后,將該模型應用到一組實際數據中進行擬合驗證.
關鍵詞: 整數值時間序列; 廣義二項稀疏算子; 門限自回歸過程; 條件最大似然估計
中圖分類號: O212.1? 文獻標志碼: A? 文章編號: 1671-5489(2023)02-0275-10
Statistical Inference for Self-exciting GeneralizedBinomial Threshold Autoregressive Model
ZHANG Jie,ZHANG Yu,DONG Xiaogang
(School of Mathematics and Statistics,Changchun University of Technology,Changchun 130012,China)
Abstract: Aiming at the modeling problem of nonlinear integer-valued time series data with upper limit and dependent structure between
data,we proposed a self-exciting generalized binomial threshold autoregressive model. Firstly,we proved the strictly stationary and ergodicity of the model,
and discussed some statistical properties of the model,including the expectation,variance,aoto-covariance and the transition probability. Secondly,we gave the conditional maximum
likelihood estimation method of the model parameters in the case of known and unknown threshold variable. Finally,we applied the model to a set of real data for fitting verification.
Keywords: integer-valued time series; generalized binomial thinning operator; threshold autoregressive process; conditional maximum likelihood estimation
收稿日期: 2022-07-29.
第一作者簡介: 張 潔(1992—),女,漢族,博士,講師,從事整值時間序列分析、 假設檢驗和變量選擇的研究,
E-mail: zhangjie@ccut.edu.cn. 通信作者簡介: 董小剛(1961—),男,漢族,博士,教授,從事金融統計分析和生存分析的研究,E-mail: dongxiaogang@ccut.edu.cn.
基金項目: 國家自然科學基金(批準號: 11901053)、 吉林省自然科學基金(批準號: YDZJ202301ZYTS384)和吉林省教育廳科學技術研究項目(批準號: JJKH20220671KJ).
1 引言與預備知識
整數值時間序列數據是一種較常見的計數數據. 由于傳統的連續型時間序列數據不能有效地刻畫整數值數據,Steutel等[1]提出了二項稀疏算子“”. 目前,關于整數值時間序列的研究已有很多結果. 在取值范圍上,該類數據可分為無上限的整數值時間序列({0,1,…})和有上限的整數值時間序列({0,1,…,n}). 對取值范圍沒有上限的計數數據,Al-Osh等[2]提出了一階整數值自回歸(INAR(1))模型; Du等[3]將一階整數值自回歸模型推廣到p階,提出了INAR(p)模型; Neal等[4]和張哲等[5]研究了該類模型的估計問題; Fernndez-Fontelo等[6]提出了一個隱性INAR(1)模型,其中隱藏層是一個具有Poisson分布的隨機過程,即Po-INAR(1)過程. 對有上限的計數數據,McKenzie[7]提出一個一階整數值二項自回歸(BAR(1))模型; Weiβ[8]研究了BAR(1)模型的性質并將其推廣到高階情形; Zhang等[9]將二項自回歸過程推廣到多項自回歸過程; Davis等[10]給出了對整數值時間序列相關研究的綜述.
上述模型均為線性模型,對具有非線性結構的整數值時間序列數據,Monterio等[11]基于二項稀疏算子,提出了一階整數值門限自回歸(SETINAR(2,1))模型,但該模型對有限計數范圍內取值的數據無效; M?ller等[12]在文獻[11]的基礎上,提出了一個二項門限自回歸(SETBAR(1))模型; Yang等[13]研究了SETBAR(1)模型的性質并將該模型應用于麻疹數據的研究中; 李晗[14]在文獻[13]的基礎上研究了該模型的經驗似然推斷問題.
由于二項稀疏算子存在Bernoulli計數序列獨立同分布假設的局限,因此不能很好地解釋具有相依性的數據. 為解決該問題,Ristic'等[15]提出了一類新的廣義二項稀疏算子“θ”,該算子能有效考慮個體之間具有相依結構的情形; 進一步,為刻畫具有相依結構的有上限整數值時間序列數據,Kang等[16]將廣義二項稀疏算子與BAR(1)模型相結合,提出了廣義二項自回歸(GBAR(1))模型,但該模型無法刻畫非線性整數值時間序列. 因此,本文在文獻[16]的基礎上,提出一個一階自激勵廣義二項門限自回歸(TGBAR(1))模型,進行相應的統計推斷,并討論該模型的統計性質和參數的條件極大似然估計問題. 最后給出該模型的數值模擬以及在實際數據中的應用.
結果為2.264 9,其中μ和σ2分別為樣本均值和樣本方差. BID的結果表明,數據自身具有過度分散的性質. 為說明模型的擬合效果,將TGBAR(1)模型應用于該數據集,并與BAR(1)模型、 GBAR(1)模型和SETBAR(1)模型進行對比,結果列于表3. 由表3可見,相比于其他3種模型,本文模型能更有效地擬合所生成的隨機數,同時更準確地估計出數據自身的統計性質,進一步說明通過TGBAR(1)模型生成的隨機數對模型的識別效果更好.
5 實例分析
實例分析數據采用2004—2005年德國的38個地區,每周至少有一個新的麻疹病例的地區數量計數數據,數據集來自于SurvStat(Robert-Koch-Institut; https://www.rki.de/EN/Home/homepage_node.html). 該組數據共105個數據點,每個點的取值范圍為{0,1,…,n},n=38由德國給定的地區數量確定. 圖2為該組數據的樣本路徑和自相關函數.
由圖2可見,數據是平穩的,并表現出一定的門限特征,因此可考慮用本文提出的TGBAR(1)模型對數據進行擬合. 圖2中橫線為通過TGBAR(1)模型預測出的門限值,該門限值有效地將數據劃分成兩部分,表明了本文模型對門限值預測的有效性. 同時,選用 BAR(1)模型、 GBAR(1)模型和SETBAR(1)模型進行對比實驗.
對上述模型分別給出參數的條件極大似然估計值、 對數似然函數值、 AIC值和BIC值,結果列于表4. 由表4可見,由于TGBAR(1)模型的參數個數較多,導致BIC的結果比SETBAR(1)模型略差,但TGBAR(1)模型的對數似然函數值最大,AIC值最小,仍能說明該模型擬合的優勢. 因此,表明TGBAR
(1)模型可以對有上限且個體之間具有相依結構的非線性整數值時間序列數據進行有效的刻畫和分析.
綜上所述,本文基于一階廣義二項自回歸模型,提出了一階自激勵廣義二項門限自回歸模型. 首先,得到其均值、 方差、 自協方差和轉移概率,并證明了模型的嚴平穩遍歷性. 其次,分別在門限已知和未知的情形下,給出了參數的條件極大似然估計方法. 模擬結果表明,有效的門限參數估計能保證其他參數的估計效果. 最后,將該模型應用于德國新感染麻疹的區域數目病例研究中,模擬結果表明,TGBAR(1)模型能較好地擬合有上限且數據之間具有相依結構的非線性整數值時間序列數據.
參考文獻
[1] STEUTEL F W,VAN HARN K. Discrete Analogues of Se
lf-decomposability and Stability [J]. The Annals of Probability,1979,7(5): 893-899.
[2] AL-OSH M A,ALZAID A A. First-Order Integer-Valued Autoregressive (INAR
(1)) Process [J]. Journal of Time Series Analysis,1987,8(3): 261-275.
[3] DU J G,LI Y. The Integer-Valued Autoregressive (IN
AR(p)) Model [J]. Journal of Time Series Analysis,1991,12(2): 129-142.
[4] NEAL P,SUBBA RAO T. MCMC for Integer-Valued ARMA P
rocesses [J]. Journal of Time Series Analysis,2010,28(1): 92-110.
[5] 張哲,張海祥,張卓飛,等. INAR(1)模型參數的Bayes 估計 [J]. 吉林大學學報(理學版),2010,48(6): 931-935. (ZHANG Z,ZHANG H X,Z
HANG Z F,et al. Bayesian Estimation of Parameters in the INAR(1) Model [J]. Journal of Jilin University (Science Edition),2010,48(6): 931-935.)
[6] FERNNDEZ-FONTELO A,MORIA D,CABAA A,et al. Estimating the Real
Burden of Disease under a Pandemic Situation: The SARS-CoV2 Case [J]. PLOS One,2020,15(13): e0242956-1-e0242956-20.
[7] McKENZIE E. Some Simple Models for Discrete Variate Ti
me Series [J]. Journal of the American Water Resources Association,1985,21(4): 645-650.
[8] WEIβ C H. A New Class of Autoregressive Models for
Time Series of Binomial Counts [J]. Communications in Statistics: Theory and Methods,2009,38(4): 447-460.
[9] ZHANG J,WANG D H,YANG K,et al. A Multinomial Autoregressive
Model for Finite-Range Time Series of Counts [J]. Journal of Statistical Planning and Inference,2020,207: 320-343.
[10] DAVIS R A,FOKIANOS K,HOLAN S H,et al. Count Time
Series: A Methodological Review [J]. Journal of the American Statistical Association,2021,116: 1533-1547.
[11] MONTERIO M,SCOTTO M G,PEREIRA I. Integer-Valued
Self-exciting Threshold Autoregressive Processes [J]. Communications in Statistics: Theory and Methods,2012,41(15): 2717-2737.
[12] MLLER T A,SILVA M E,WEIβ C H,et al. Se
lf-exciting Threshold Binomial Autoregressive Processes [J]. AStA Advances in Statistical Analysis,2016,100(4): 369-400.
[13] YANG K,WANG D H,LI H. Threshold Autoregression Analysis for Finite-Range Time Series of Counts with an Application on Measles Data
[J]. Journal of Statistical Computation and Simulation,2018,88(3): 597-614.
[14] 李晗. 幾類整數值門限時間序列模型的統計推斷 [D]. 長春: 吉林大學,2018. (LI H. Statistical Inference for Several Classes of Integer
-Valued Threshold Time Series Models [D]. Changchun: Jilin University,2018.)
[15] RISTIC' M M,NASTIC' A S,MILETI
C' ILIC' A V. A Geomet
ric Time Series Model with Dependent Bernoulli Counting Series [J]. Journal of Time Series Analysis,2013,34(4): 466-476.
[16] KANG Y,WANG D H,YANG K. Extended Binomial AR(1) Proces
ses with Generalized Binomial Thinning Operator [J]. Communications in Statistics: Theory and Methods,2020,49(14): 3498-3520.
[17] ROSS S M. Stochastic Processes [M]. New York: John Wiley & Sons,1996: 175.
[18] BILLINGSLEY P. Statistical Inference for Markov Processes [M]. Chicago,IL: University of Chicago Press,1961: 10-23.
[19] WANG C,LIU H,YAO J F,et al. Self-excited Threshold Poiss
on Autoregression [J]. Journal of the American Statistical Association,2014,109: 777-787.
[20] CHENG X X,LI W K,YU P L H,et al. Modeling Threshold Conditional Heteroscedasticity
with Regime-Dependent Skewness and Kurtosis [J]. Computational Statistics & Data Analysis,2011,55(9): 2590-2604.
(責任編輯: 李 琦)