999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

高維附加信息下的商業醫療保險費用評估模型和方法

2013-12-04 06:23:24趙曉兵王偉偉
財經論叢 2013年4期
關鍵詞:方法模型

趙曉兵,王偉偉

(浙江財經大學數學與統計學院,浙江 杭州 310018)

一、引 言

商業醫療保險是社會醫療保障體系最主要的補充支柱。在社會醫療保險中,醫療費用的評估非常重要,但是由于醫療費用數據分布的特殊性[1],例如費用數據往往呈偏態分布;醫療費用和保險者的生存時間有密切的聯系;由于有刪失和死亡事件的發生,導致患者的醫療費用在這兩種情況下是不相互獨立的;還有部分投保者在一定時間內沒有費用的發生等等。這些都給醫療費用的評估帶來了很大的挑戰。在國外,已經有大量文獻定量研究醫療費用,提出了許多精確刻畫醫療費用的一些統計模型和方法。在醫療費用中普遍使用的方法包括數據變換方法[2][3][4]、廣義線性模型方法[5][6]、混合參數分布模型方法[7][8][9]、混合效應模型方法[10]等等。Mihaylova(2010)[11]針對此問題有過專門研究,在這些方法中尤其以數據變換方法和廣義線性模型最為常用。

廣義線性模型是目前醫療費用分析中比較普遍的一種方法。然而,廣義線性模型總是假定聯系函數是一個已知函數,而這個已知函數的選擇需要專業知識。另外,廣義線性模型總是基于低維附加信息進行統計分析,當含有所有高維協變量的時候,傳統的廣義線性模型不再適用。隨著生物技術的大力發展,基因表達(gene expression)和單核苷酸多態性(single nucleotide olymorphism-SNP)分析等的出現,使得新類型的數據往往含有大范圍的附加信息,即所謂的“高維協變量”。

針對現有醫療費用評估方法中存在的局限性,本文將Lin(2003)[6]的模型延伸到可以允許含有高維附加信息的醫療費用評估模型,然后提出一個新的評估方法,從而更準確地評估醫療費用。該模型有兩個特點:一是可以允許高維附加信息的存在,二是假設聯系函數總是未知的。最后通過模擬和實例分析來評價我們提議的模型和方法。

二、模 型

假設因變量Yi(i=1,2,…n)為醫療保險賠付金額,解釋變量Xi1,Xi2,…,Xip為影響醫療保險賠付的風險因子。對上述醫療費用數據,Lin(2003)[6]提出了如下模型:

其中Xi=(Xi1,Xi1,…Xip)T,β=(β1,β2…βp)T,并且假設聯系函數g是已知的。

然而此模型也存在如下的局限性:一是我們總是將協變量定義為低維協變量;二是在該模型中,聯系函數g總是被完全參數化,這樣就使模型缺乏一般性和靈活性。

基于該模型存在的不足,在本文中,我們將其做進一步延伸:即我們允許聯系函數g完全非參數化,協變量Xi可以是高維協變量。具體地講,我們提議如下的多指標模型:

其中的聯系函數g可以完全未知,附加信息Xi的維數可以是高維的,這種情況在醫療費用中很常見,例如伴隨著費用的信息有年齡、性別、病種、住院醫院的級別等等多達30個信息(見后面的實例分析),這些信息都會對醫療費用的發生產生影響。就目前文獻中的方法而言,研究者往往根據自己的經驗挑選幾個變量作為附加信息,而這樣的做法很容易遺漏一些重要變量。因此,最近以來,充分降維方法被廣泛使用在該類數據分析中,其最大的優點在于:一是不需要假設因變量和自變量的具體分布形式;二是不同于主成分分析等,在充分降維過程中考慮到了響應變量的因素;三是不同于變量選擇方法去挑選某些變量,而是尋找變量的若干個線性組合。這些優點使得充分降維成為目前處理高維數據的熱點和有力工具。

有鑒于此,我們把醫療保險費用賠付表示成為一個標準的回歸模型:

其中 E [εi] =0,εi與 Xi1,Xi2,…Xip相互獨立。

就上述模型而言,為了避免所謂的“維數禍根”,首要任務就是對高維協變量Xi進行降維,本文中,我們將利用充分降維(sufficient dimension reduction)方法尋找協變量的d個線性組合XTiβ1,如果d?p,就達到我們對協變量降維的目的。此時我們的模型可以簡化為如下的多指標模型:

注意到在模型(3)中g是p-元函數,而在(4)中是d-元函數,在不至于引起混淆的情況下,我們仍將其記為函數g。

本文就是在模型(4)基礎上,首先獲得協變量的中心降維子空間的維數和基方向,然后再利用局部回歸方法對完全非參數化的聯系函數g進行估計。

三、模型估計

(一)充分降維

本文將利用充分降維方法對協變量進行降維,充分降維方法的重要特點是通過尋找變量的線性組合從而達到降維的目的。這種降維方法不需要任何參數模型,且不損失任何分布的信息。從統計理論的角度講,其描述如下:

令Y表示響應變量(可以是多維的),X為P×1維協變量向量。充分降維方法就是要在?P上尋找一個最小子空間S,S滿足:

其中,⊥表示Y和X條件獨立,PS表示關于內積的投影算子。滿足這個條件的子空間我們稱之為降維子空間。在最小子空間的條件下,我們將該子空間稱為中心降維子空間(CDR)。以后我們將該CDR子空間記為SY|X。我們假定空間SY|X總是存在的,并且SY|X的維數d為Y關于X回歸時的結構維數。

SY|X包括了Y|X所有的回歸信息。在充分降維方法中有很多估計SY|X的方法,其中切片逆回歸(SIR)[12]是目前較為常用與方便的使用方法。本文將使用修訂的切片逆回歸方法(MSIR)[13],我們將Y劃分成一定數目的相互不重疊的間隔,其中每一部分稱之為切片。取每一部分X的平均作為E(X|Y)的估計。下面我們利用MSIR求出SY|X。

首先要構造一個p×h的矩陣B=(β1,β2,…,βh),

我們可以得到βk的如下估計,即:

為了估計結構維數d=dim(SX|Y),我們采用Zhu,Miao,and Peng(2000)[14]提出的BIC方法:我們令的特征值,κ表示中大于1的特征值的數目。則d的估計為使下式最大化時的m的值:

其中,m∈{0,1,…,p-1}。另外在上式中Cn是懲罰因子。通常我們將Cn=Op(na)。在本文實例分析中,我們將a=0.1。

(二)多元局部回歸

在降維的基礎上,對聯系函數g應用局部回歸方法對其進行估計。本文考慮的回歸模型為:

假定其樣本數據(X1,Y1),(X2,Y2),…,(Xn,Yn)為獨立同分布的隨機向量。其中Yi為響應變量,Xi為d維協變量。首先將未知函數g(Xi)在點x處展開成q階Taylor展示如下(本文假設

將其帶入回歸模型(4),由下式可以得到我們需要的估計:

其中β=(β1,…,βd)T,H為d×d維的實正定矩陣,K(·)是d維變量的核,其中∫K(u)du=1,KH(u)=|H|-1/2K(H-1/2u)。我們稱H-1/2為帶寬矩陣,它是我們常用的帶寬參數的多元擴展。則上式的解為:

其中:

四、數值模擬

(一)結構維數d=1的數值模擬

利用模型Y=sin(βTX)+(βTX+2)2+ε產生400個數據點,其中X維數p=10,d=1,β=(1,1,1,1,0,…,0)T,X中的每一變量和ε獨立同分布于標準正態分布。在此模型中,任意和β成比例的向量均為其中心降維子空間。下表我們給出利用MSIR方法得到的^β的均值與方差,該模擬進行了100次。

利用MSIR降維我們得到估計的結構維數d=1,在下表中,我們可以看出利用SIR的估計效果是非常好的,且對切片數的選取不敏感,我們切片分別為5,10,15。其均值很接近標準化的β。

表1 的均值與方差

表1 的均值與方差

15 0.4624 0.1298 0.4469 0.1161 0.4784 0.1124 0.4706 0.1118 0.0145 0.1220-0.0182 0.1237-0.0005 0.1209 0.0016 0.1176 0.0043 0.1136-0.0232 0.1213

在降維的基礎上,我們利用局部回歸方法估計回歸函數,其估計曲線連同散點圖列在圖1中。在上述估計中,我們把帶寬選為核函數由下面曲線可以看出,局部回歸對數據點進行了很好的擬合。

圖1 估計曲線與散點圖

(二)結構維數d=2的數值模擬

利用MSIR降維我們得到估計的d=2,利用估計的β^與真實的β的相關系數R2(β)來評級估計的貼近程度,R2越接近1我們的估計效果越好。由下表可以看出MSIR方法得到的結果非常好,我們切片分別選為5,10,15。

表2 降維得到^β與真實值β之間的相關系數

在降維的基礎上,我們也可以利用局部回歸方法給出回歸曲線的估計。同樣的,我們把帶寬選為h,核函數選為均勻核由圖形①如需要圖像,可向作者索要。可以看出局部回歸估計對該散點圖進行了很好的擬合。

五、實例分析

本文根據2008年某商業保險公司在上海和四川兩地推廣的一個醫療保險產品的理賠數據,研究醫療損失對影響因素的響應關系。仇春涓(2012)[15]挑選了若干設計變量,利用廣義線性模型分析了上述數據。正如前面敘述的一樣,本文利用模型(4)再次分析該組數據,通過尋找變量的若干線性組合達到降維的目的。

這里簡單描述一下數據的結構,其中因變量是一份醫療保險合同在一個固定保險期內的最終賠款額。影響因素為所有可能的變量,一共30個變量。我們主要介紹幾個比較重要的變量:

(1)被保險人所在的地區(0表示四川地區,1表示上海地區);

(2)被保險人性別(0表示男性,1表示女性);

(3)險種保障檔次(1,2,3三個檔次,一檔的限額最低,三檔的限額最高);

(4)被保險人年齡:以歲數為單位;

(5)醫院級別(1,2,3三級別,0表示未分級);

(6)住院天數;

(7)案件意外代碼(0表示案件非意外發生,1表示案件意外發生)。

為了消除變量量綱的差異,我們標準化了所有協變量。利用MSIR方法對協變量進行降維,得到估計的結構維數d=1和中心降維子空間的基方向^β,^β的值見下表。

表3 基方向^β的值

從而得到協變量的線性組合XTβ,在該線性組合中,對應變量影響較大的變量主要有:被保險人地區、險種保障檔次、性別、醫院級別、案件是否意外發生。在降維的基礎上,我們利用局部回歸估計得到聯系函數g(x)的估計。在分析該組數據中,我們選取帶寬為h=2.34*,其中n為樣本數據個數。核函數選為K(u)=(1-u2),-1≤u≤1。g(x)的估計曲線列在圖2中,從圖2中,我們可以看出x與y之間近似單調遞減的關系。

圖2 估計曲線

通過基方向和回歸曲線的估計,我們可以得出以下結論:

(1)地區,0表示四川,1表示上海。在降維得到的線性組合中,地區的系數為-0.0655,由圖像我們可知,相同的險種在上海的賠付要比在四川的賠付高。商業醫療保險在賠付上的差異產生了地區的不公平性,這點和仇春涓(2012)[15]的分析相吻合。

(2)險種的保障檔次,分為1,2,3級。在降維得到的線性組合中,其系數為-0.9363,說明險種的保障檔次對保險的賠付額的影響尤其明顯。保險檔次越高,賠付額越高,這點和仇春涓(2012)[15]的分析是一致的。

(3)被保險的性別,0表示男性,1表示女性。在降維得到的線性組合中,性別的系數為-0.1512,我們得出女性在保險賠付中要比男性的賠付高。這一點與仇春涓(2012)[15]的結論不一致。仇春涓(2012)[15]得出的結論為性別對醫療保險的賠付無顯著影響。

(4)年齡,年齡的系數為0.0001,其對保險賠付的影響很小。這點和仇春涓(2012)[15]的結論相吻合。一般來說,我們都認為年齡是影響醫療費用的一個非常重要的因素,但由數據我們可以看出,我們研究的對象年齡都是60歲以下的,低齡兒童在投保人群中占很大比重沒有涉及到60歲以上的老年人群,所以年齡因素的影響不顯著。

(5)醫院級別,分為1,2,3級別,0表示未分級。醫院級別的系數為-0.3061,醫院級別越高,賠付的金額越高。醫院級別越高,醫院的功能、設施、技術力量等綜合水平越高,患者的住院費用也就越高,從而醫療保險的賠付額越高,這點和仇春涓(2012)[15]的結論相吻合。

(6)住院天數。住院天數的系數為-0.0092,住院天數越長,醫療保險的賠付越高。然而住院天數對賠付額的影響并不十分顯著。這和仇春涓(2012)[15]的結論不一致。仇春涓(2012)[15]認為住院天數是影響醫療保險賠付非常重要的因素。理論上,住院天數越長,醫療費用越高,保險賠付越高。然而,醫院的級別,是否手術,是否放射等因素對住院費用也有很大的影響,使得住院天數對醫療保險賠付的影響并不是那么顯著。

(7)案件意外代碼,0表示案件非意外發生,1表示案件意外發生。其系數為0.0492,表明案件意外發生時,保險賠付額小于案件非意外發生時的賠付額。該變量在文獻 [15]中并未考慮。其他變量也可以依次分析,在此不再一一列出分析結果。

六、總 結

在本文中,我們對傳統模型進行了改進,將Lin(2003)[6]醫療費用模型中的聯系函數非參數化,這使得該模型更具一般性和更大的靈活性,該模型也允許有高維協變量的存在。我們采用兩步估計的方法來估計模型參數,首先利用MSIR對高維的協變量進行降維,在得到中心降維子空間的基方向和結構維數后,利用局部回歸去估計完全未知的回歸函數。該模型和方法提供了一個處理含有高維協變量的醫療費用數據的一種有效選擇。在本論文中,我們主要研究醫療費用的具體金額,而沒有考慮醫療保險索賠次數的分布等問題,這將是我們以后要繼續研究的問題。

感謝華東師范大學金融與統計學院仇春涓博士提供了第五節中的數據。

[1]Xiaobing Zhao,Xian Zhou.Estimation of Medical Costs by Copula Models with Dynamic Change of Health Status[J].Insurance:Mathematics and Economics,2012,Vol(51):480-491.

[2]Mullahy,J..Much Ado about Two:Reconsidering Retransformation and Two-part Model in Health Econometrics [J].Journal of Health Economics,1998,Vol(17):247-281.

[3]Manning,W.G.and Mullahy,J..Estimating Log Models:to Transform or Not to Transform? [J].Journal of Health Economics,2001,Vol(20):461-494.

[4]Ettner,S.L.,Frank,R.G.,McGuire,T.G.,Newhouse,J.P.and Notman,E.H.Risk Adjustment of Mental Health and Substance Abuse Payments[J].Inquiry,1998,Vol(35):223-239.

[5]D.Y.Lin.Linear Regression Analysis of Censored Medical Costs.Biostatistics[J].Biostatistics,2001,Vol(1):35-47.

[6]D.Y.Lin.Regression Analysis of Incomplete Medical Cost Data[J].Statistics in Medicine,2003,Vol(22):1181-1200.

[7]Nixon,R.M.,Thompson,S.G..Parametric Modeling of Cost Data in Medical Studies[J].Statistics in Medicine,2004,Vol(23):1311-1331.

[8]Zhou,X.H..Estimation of the Log-normal Mean [J].Statistics in Medicine,1998,Vol(17):2251-2264.

[9]Briggs,A.,Nixon,R.,Dixon,S..Parametric Modeling of Cost Data:Some Simulation Evidence [J].Health Economics,2005,Vol(14):421-428.

[10]Lin,D.Y.,Feuer,E.J.,Etzioni,R.,Wax,Y..Estimating Medical Costs from Incomplete Follow-up Data [J].Biometrics,1997,Vol(53):419-434.

[11]Mihaylova,B.;Briggs,A.;O'Hagan,A.and Thompson S.G.Review of Statistical Methods for Analyzing Healthcare Resource and Costs[J].Health Economics.2011,Vol(20):897-916.

[12]K.C.Li.Sliced Inverse Regression for Dimension Reduction(with discussion)[J].Journal of the American Statistical Association,1991,Vol(86):316-327.

[13]Wenbin Lu,Lexin Li.Sufficient Dimension Reduction for Censored Regressions[J].Biometrics.2011,Vol(67):513-523.

[14]Zhu,L.X.,Miao,B.,and Peng,H.On Sliced Inverse Regression with Large Dimensional Covariates[J].Journal of the American Statistical Association,2006,Vol(101):630-643.

[15]仇春涓,陳滔.商業醫療保險損失分析:基于廣義線性模型的實證研究[J].應用概率統計,2012,(28):389-399.

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 日韩精品中文字幕一区三区| 91小视频在线观看免费版高清| 国产真实自在自线免费精品| 97综合久久| 亚洲乱强伦| a欧美在线| 亚洲国产第一区二区香蕉| 国产九九精品视频| 亚洲无码高清视频在线观看 | 久久伊人久久亚洲综合| 午夜精品福利影院| 99久久国产自偷自偷免费一区| 国产色婷婷视频在线观看| 欧美午夜网站| 综合色区亚洲熟妇在线| 精品99在线观看| 丝袜久久剧情精品国产| 欧美视频免费一区二区三区| 久久国产乱子| 大香伊人久久| 热久久国产| 女人一级毛片| 国产大片喷水在线在线视频| 国产一级妓女av网站| 亚洲欧美成人综合| 国产亚洲精品无码专| 国产极品美女在线| 国产呦精品一区二区三区网站| 高清久久精品亚洲日韩Av| 精品一区二区三区波多野结衣| 亚洲美女视频一区| 最新亚洲人成网站在线观看| 韩日无码在线不卡| 亚洲欧美日韩视频一区| 国产女人综合久久精品视| 成人午夜视频网站| 中文字幕亚洲第一| 秋霞一区二区三区| 亚洲乱码在线视频| 国产免费看久久久| 国产成年无码AⅤ片在线| 国产乱子伦手机在线| 久久国产精品国产自线拍| 国产三级国产精品国产普男人| 热99精品视频| 久久综合亚洲色一区二区三区| 国产成人午夜福利免费无码r| 国产精品视屏| 国产va在线观看| 久久一日本道色综合久久| 在线观看视频99| 丝袜无码一区二区三区| 九九热这里只有国产精品| 亚洲愉拍一区二区精品| 99re视频在线| 国产亚洲高清视频| 久久免费精品琪琪| 99热这里只有精品5| 自拍欧美亚洲| 日本草草视频在线观看| 美女内射视频WWW网站午夜 | 欧美一区国产| 久久免费视频播放| 日本五区在线不卡精品| 欧洲高清无码在线| 美女国产在线| 老熟妇喷水一区二区三区| 国产一在线| 91精品国产情侣高潮露脸| 亚洲成人动漫在线| 国产精品自在拍首页视频8| 91麻豆精品视频| 高清免费毛片| a色毛片免费视频| 丰满人妻久久中文字幕| 欧洲欧美人成免费全部视频| 久久国产高清视频| 久久久久久久97| 永久免费av网站可以直接看的| 精品伊人久久久香线蕉| 日韩资源站| 精品国产毛片|