段星德,張 實(shí),羅露璐,張文專
(貴州財(cái)經(jīng)大學(xué)數(shù)統(tǒng)學(xué)院,貴州貴陽550025)
Tweedie復(fù)合泊松分布常用來分析由零和正的連續(xù)數(shù)據(jù)所構(gòu)成的半連續(xù)型數(shù)據(jù),這類數(shù)據(jù)廣泛存在于精算科學(xué)(比如:保險(xiǎn)公司對不同個(gè)體的賠償金額),環(huán)境科學(xué)(比如:一段時(shí)間某個(gè)地區(qū)的降雨量)等研究領(lǐng)域中.對半連續(xù)數(shù)據(jù)建模常見的有兩類方法,第一,兩部分模型,即混合Bernoulli分布和Gamma分布或者Lognormal分布,常被用來分別處理零數(shù)據(jù)和正的連續(xù)數(shù)據(jù)兩部分(Fernandes等[1],Piantadosi等[2]),然而這種分割處理方法常會破壞半連續(xù)數(shù)據(jù)的整體屬性(Hasan等[3]).第二,Hasan等[3]以及Hasan和Dunn[4-6]發(fā)展了Tweedie復(fù)合泊松模型來對降雨量和降雨發(fā)生率聯(lián)合建模.進(jìn)一步,針對Tweedie復(fù)合泊松模型的統(tǒng)計(jì)推斷問題,Smyth和J?rgensen[7]研究了Tweedie復(fù)合泊松模型的均值和散度參數(shù)的聯(lián)合建模問題以及約束極大似然估計(jì)方法;Dunn和Smyth[8-10]提出了不同的數(shù)值方法去逼近Tweedie復(fù)合泊松分布的密度函數(shù)并給出了R軟件包;Peters等[11]給出了Tweedie復(fù)合泊松模型的極大似然估計(jì)和基于Markov Chain Monte Carlo(簡稱MCMC)模擬技術(shù)的Bayes估計(jì);Zhang[12]基于Monte Carlo EM和MCMC等算法研究了Tweedie復(fù)合泊松混合效應(yīng)模型的估計(jì)問題;Qian等[13]基于分組彈性網(wǎng)估計(jì)技術(shù)研究Tweedie復(fù)合泊松模型的變量選擇問題;Yang等[14]把梯度提升樹算法應(yīng)用到Tweedie復(fù)合泊松模型中并用來預(yù)測半連續(xù)保險(xiǎn)數(shù)據(jù);Bonat等[15]提出兩類擬似然和偽似然方法對Tweedie復(fù)合泊松模型進(jìn)行統(tǒng)計(jì)推斷.但據(jù)作者所知,基于Bayes數(shù)據(jù)刪除方法對Tweedie復(fù)合泊松模型的統(tǒng)計(jì)診斷分析還沒得到研究.
近幾年來,基于Bayes數(shù)據(jù)刪除影響診斷以引起大……