許瓊瓊 肖 靜 沈 康 仲亞琴 強福林 吳徐明 袁麗萍 高月霞△
?
基于決策樹模型食管癌病例組合研究*
許瓊瓊1肖靜1沈康2仲亞琴1強福林2吳徐明2袁麗萍2高月霞1△
【提要】目的探索南通市食管癌病例的DRGs分組方案及費用標準,為相關部門決策提供依據。方法對2006-2013年南通市腫瘤醫院以食管癌為主要診斷的11784例病案數據進行多重線性回歸分析,篩選分類節點變量,運用決策樹模型進行病例分組,采用絕對值法和相對權重法對住院費用的標準進行測算。結果治療方法、首次入院、年齡、性別、伴隨疾病、并發癥、轉歸等作為食管癌病例分類節點的關鍵變量,建立了21個DRGs組及住院費用標準。結論病例分組結果合理,住院費用標準和病種權重可以作為相關部門參考。
食管癌住院費用疾病診斷相關組決策樹
食管癌是中國常見的惡性腫瘤之一,嚴重威脅著居民健康。據報道,2010年江蘇省食管癌的發病率為41.93/10萬,死亡率31.15/10萬,腫瘤發病率和死亡率均排名第3[1]。食管癌患者的疾病負擔較重,住院費用比較高,變異比較大,最小值在1萬元,最大值近30萬,平均4.7萬元[2-3]。這主要與國內現行的醫保付費方式有關,按服務項目的后付制支付方式,導致過度醫療和醫療費用快速增長。按病種支付等預付制,被認為是有效控制醫療費用增長的支付方式之一。早在1983年美國引進基于DRGs分組的預付費機制[4],有效地控制了醫療費用的增加。歐洲很多國家相繼引進基于DRGs的支付機制[5]。2012年中國政府在北京的6家醫院進行DRGs付費制度試點改革,改革后患者的住院總費用降低了6.2%,個人自付費用降低了10.5%[6]。DRGs分組是基于疾病自身特點、治療手段、有無并發癥或合并癥等情況,根據資源消耗的程度制定付費疾病分組標準。國內學者從20世紀80年代開始,研究探討建立適合我國國情的疾病診斷相關分組及費用標準制定和成本核算,如陳龍[7]等對高血壓患者進行了DRGs病例組合的費用測算,楊曉蓉[8]對循環系統的病例組合方案進行制定和評價。國內還沒有食管癌患者的病例組合研究報道,本研究對南通市某腫瘤專科醫院11 784例食管癌患者進行住院費用分析,基于數據挖掘的決策樹模型進行DRGs分組及費用測算評價,為醫保預付費制度實施提供依據。
1.數據來源
數據來源于南通市腫瘤醫院2006年1月至2013年12月診斷為食管惡性腫瘤的住院病人病案首頁數據庫,將出院主診斷不是食管癌的病案剔除。為了減少離群值對研究結果的影響,數據預處理的排除標準如下:(1)將住院天數小于1或大于100天的病案剔除;(2)將住院費用小于1%或大于99%的病案剔除。經過篩選納入的有效數據為11784例,年齡最小22歲,最大99歲,平均年齡(63.82±8.30)歲,中位年齡64歲。
2.研究變量及賦值
本研究以住院費用作為因變量,所有住院費用用當年的居民消費價格指數(CPI)調整,住院費用最小值為1855元,最大值70969元,平均(22065±14667)元。以年齡、性別、首次入院、伴隨疾病等作為自變量,進行多重線性回歸,用方差膨脹因子(VIF)進行共線性診斷,篩選分類節點變量。變量分布及賦值見表1,樣本中有63.4%的病人醫療保險狀況為自費,該樣本主要是異地就醫的病人。

表1 11784例食管癌患者基本特征及賦值
3.病例組合方法
采用SPSS20.0軟件進行數據統計分析和決策樹模型(decision tree)構建與修剪[9],卡方自動交互檢測(CHAID)算法構建決策樹,交叉驗證方法(cross validation)對樹模型自動修剪,樣本群數為10。住院天數為影響食管癌住院費用的重要變量[10,14],本研究將住院天數作為影響變量納入決策樹模型。以住院費用為因變量,以住院天數為影響變量,以性別、年齡、伴隨疾病、并發癥、治療方法等作為分類節點。本研究參數設置使用:決策樹最大深度為3,父節點的最小樣本數為100,子節點的最小樣本數為50,拆分節點的檢驗水準α=0.05。分組效果評價:組間的差異用非參數Kruskal-Wallis檢驗,組內變異用變異系數(CV)來檢驗分組的合理性。
1.分類節點變量篩選
住院費用多重線性回歸結果見表2,從標準偏回歸系數可知,手術、放療及化療對住院費用的影響最大,其次是首次入院和醫保方式對住院費用的影響較大,疾病轉歸、年齡、性別、有無伴隨疾病及有無并發癥也是住院費用的影響因素。模型的共線性診斷表明,所有VIF<5,可以認為不存在共線性問題。以治療方式、首次入院、疾病轉歸、有無并發癥、有無伴隨病、年齡和性別作為分類節點變量。

表2 食管癌住院費用多重線性回歸分析
2.分類結果
本研究11 784例食管癌病例共形成21個DRGs組合,各分組的均數、中位數、標準差及變異系數見表3。為確定分組的合理性,我們對各病例組合進行非參數Kruskal-Wallis檢驗,結果均是P<0.001,說明住院費用組間異質性較好。各病例組合變異系數CV值見表3,中位數與均數比較接近,說明組內差異較小,分組較為合理。

表3 食管癌DRGs分組結果(住院費用,元)
3.病例組合住院費用的相關標準制定
基于以上方法病例分組后,可以用住院費用中位數制定費用參考值的標準[11],計算住院費用上限時,采用各組合住院預測費用的75%加1.5倍四分位間距[12]。本研究中,食管癌患者住院費用超過費用上限定義為超標費用,超標總例數為978,占本次研究總例數的8.3%。計算各DRG組的病種權重[13],是指該種DRG組合的例均住院費用與所有病例平均費用的比值,權重越高,說明病人消耗的資源越多,具體見表4。

表4 食管癌DRGs分組的住院費用標準及病種權重
本研究中基于決策樹中的回歸樹模型,將11784例食管癌病例根據不同的治療方案分成21個組,組間異質性較大,組內異質性較小,分組合理。分組變量沒有選擇住院天數,主要是考慮到國內還沒有實施規范化的臨床路徑管理,住院天數的變異較大,這與國內現有的研究一致[7-8,12]。住院天數作為影響住院費用的重要變量[10,14],不能作為分組變量,可以作為影響變量,納入到決策樹模型。與現有的研究相比,這是本研究在模型設定方面的重要改進。與傳統的多重線性回歸相比,決策樹模型不要求變量具有特定的分布,對存在離群值和有偏分布的數據不太敏感,通過交叉驗證等方法對模型進行合理剪枝,可達到穩定可重復的效果[14]。缺失值的處理也是決策樹模型一大優勢,本研究將缺失值作為單獨一類,獨立分組效果較好,符合臨床實踐中實際住院費用的分布。
分類節點變量選擇合理,分組效果較好。首次入院是影響腫瘤住院費用的重要變量,本研究發現在化療治療病例組合中,首次入院組住院費用的中位數較高,這在醫療保險相關部門決策中參考價值較大。治療效果、年齡、并發癥和伴隨疾病是影響各組的主要變量,手術組病例組合中,有并發癥組的費用高于沒有并發癥;放療病例組合中,59歲以上治愈組費用最高。另外,沒有將醫保方式納入到決策樹模型,主要是由于分組決定因素是疾病的社會學特征與疾病特征。在醫保部門實際運用過程中,可以根據各地醫保籌資情況,在住院費用標準基礎上適當地增加權重。另外,疾病嚴重程度未能納入回歸樹模型中[15],主要與病案質量有關,在以后的研究中應進一步完善。
本研究從2006年到2013年時間跨度比較長,研究樣本量大,通過交叉驗證剪枝,病例組合分組可重復性強,病例組合費用具有很強的參考價值。在醫保部門實際應用中,主要有住院費用絕對值法和病種相對權重系數法[13]。相對權重系數法是指先根據一定的原則確定一個基準組合,用各組合的平均費用與基準組合平均費用的比值表示相關權重系數。通過計算各病種相對權重系數,可以連接所有的病種,進行按病種分值結算,體現醫保支付的科學性。因此,醫保部門在實際運用過程中,可以根據這些分組費用之間的比例關系,醫保基金的實際支付能力,確定一個合適的參考值。病例組合醫療費用的參考價值在于分類標準的確定,而不是具體的費用絕對值的大小。
[1]韓仁強,武鳴,俞浩,等.2010年江蘇省腫瘤登記地區惡性腫瘤發病與死亡.江蘇預防醫學,2015,1:5-10.
[2]葉斌.食管癌手術患者住院費用及影響因素研究.浙江大學,2015.
[3]胡志平,馮向先,潘雄飛.食管癌患者住院費用影響因素分析.中國公共衛生,2013,3:315-317.
[4]Hsiao WC,Sapolsky HM,Dunn DL,et.al.Lessons of the New Jersey DRG payment system.Health Affair,1986,5(2):32-45.
[5]Busse R,Geissler A,Aaviksoo A,et al.Diagnosis-related groups in Europe:moving towards transparency,efficiency and quality in hospitals.Open University Press,Maidenhead,93-114.
[6]Jian W,Lu M,Chan KY,et al.Payment reform pilot in Beijing hospitals reduced expenditures and out-of-pocket payments per admission.Health Affair,2015,34(10):1745-52.
[7]陳龍,馬利,何文英,等.高血壓住院患者DRGs分組方法研究.中國衛生統計,2015,32(1):110-111.
[8]楊曉蓉,吳明.循環系統病例DRGs組合研究.中國衛生統計,2010,27(2):163-165.
[9]Fetter RB,Mills RE,Riedel DC,et al.The application of diagnostic specific cost profiles to cost and reimbursement control in hospitals.Journal of Medical Systems,1977,1:137-49.
[10]楊梅,肖靜,陳德喜,等.8288例食管癌患者住院費用影響因素的通徑分析.現代預防醫學,2013,5:801-803.
[11]董軍,胡德奎,陳劍偉,等.病種費用控制標準實驗研究.中華醫院管理雜志,2001,9:529-531.
[12]高建民,鄭古崢玥,詹梅,等.基于疾病診斷相關組合的住院費用標準合理化探討.中國衛生經濟,2013,3(1):22-24.
[13]趙一鳴.對回歸樹的建模與應用一文的幾點補充.中華預防醫學雜志,2003,27(3):141-145.
[14]高建民,鄭古崢玥,詹梅,等.疾病診斷相關分組分類節點變量的選擇及其分組結果的合理性評價.中國衛生經濟,2013,3(1):16-19.
(責任編輯:劉壯)
Case-Mix Study of Patients with Esophageal Cancer Based on Decision Tree
Xu Qiongqiong,Xiao Jing,Shen Kang,et al
(Department of Health Statistics,School of Public Health,Nantong University(226004),Nantong)
ObjectiveThe study explored the case-mix diagnosis-related-groups of patients with esophageal cancer in Nantong and developed related health expense standards,so as to provide evidence for related departments′ decisions.MethodsAccording to 11 784 inpatients with the principal diagnosis as esophageal cancer from 2006 to 2013 in Nantong tumor hospital,multiple regression model was employed to screening the classification node variables,and the decision tree model was applied to set up the case-mix diagnosis-related-groups.The absolute value method and relative weights were used to calculate the standard.ResultsThe main classification node variables were therapies,first hospitalization,age,gender,concomitant diseases,complication,and prognosis.21 diagnosis-related-groups and related health expense standards were established.ConclusionCase-mix diagnosis-related-groups are reasonable,and the health expense standards and related case weight could make
for related departments.
Esophageal cancer;Hospitalization expense;Diagnosis-related-groups;Decision tree
南通市科技局社會發展項目資助(HS2013004);南通大學博士科研啟動基金(14B16)
高月霞,E-mail:gaoyuexia1103@163.com
1.南通大學公共衛生學院流行病衛生統計系(226004)
2.南通市腫瘤醫院科教科