陳 龍馬 利何文英彭云紅
高血壓住院患者DRGs分組方法研究
陳 龍1馬 利2△何文英2彭云紅2
目的以高血壓病作為一個DRGs基本組探討細分DRGs的方法。方法利用決策樹模型,使用CHAID算法將高血壓住院患者進行分組,評價分組后的組間與組內的差異。結果利用決策樹模型共得到6個高血壓的DRGs細分組。結論利用決策樹模型DRGs的分組,找到的分組的節點具有可行性,建議本地區將DRGs分組測算結果作為病種醫療付費的參考標準。
高血壓 決策樹 疾病診斷相關分組
醫療保險設立的目標主要是通過多方主體共同籌資,建立醫療費用的分擔機制來達到保護被保險者享有醫療的權利。但這一權利在實行醫療保險制度后,受到兩個方面的挑戰:一是醫療保險支付水平低,二是醫保費用不斷攀升,醫保不堪重負。究其實質是醫療費用快速增長超出醫保基金的承受能力[1]。
針對上述問題,政府及醫保機構采取了多種措施。其中支付方式改革受到越來越多的關注,疾病診斷相關組(diagnosis related groups,DRGs)作為目前公認的有效控制醫療成本、降低醫療費用、規范醫療服務質量的最具可行性的管理模式與費用支付方式[2],目前已在部分地區應用。DRGs的分組過程是按照解剖學或病因學標準分成多個主要診斷類目(如循環系統疾病、消化系統疾病等),再按有無手術操作分為手術治療和非手術治療,(非)手術治療再分為不同的基本組,最后基本組依據年齡、并發癥與合并癥、出院情況等因素進行分組得到DRGs的細分組。
本研究參照DRGs的分組過程及分組原理,利用決策樹CHAID算法對循環系統非手術治療部分高血壓這一基本組進行細分,得到高血壓的DRGs細分組,并且判斷分組是否合理。為今后該地區實施常見病病種支付、不同醫療服務機構提供的服務效率和質量進行比較提供方法學基礎,并探索DRGs在當地實行的技術可行性。
1.數據來源
本研究收集新疆生產建設兵團某三級甲等醫院在運行新的病歷系統后,自2012年5月至2013年5月住院病例的病案首頁中主要診斷為高血壓?。↖CD-10前三位編碼為I10-I15)的相關信息。數據庫中的主要變量有住院號、姓名、性別、年齡、費別、醫療保險號、職業、民族、入出院日期、總費用及各項費用、離院方式、主要診斷及編碼和次要診斷及編碼,其中主要診斷、次要診斷為ICD-10編碼。共收集到2484例病例。排除缺項、漏項以及有邏輯錯誤的病例,共獲2069例,包括特發性(原發性)高血壓(I10)2002例,占96.77%;高血壓心臟?。↖11)53例,占2.56%;其他類型的高血壓14例,占0.68%。
2.分組方法
卡方自動交互檢測(Chi-square automatic interaction detection,CHAID)是一種基于目標變量自我分層,用卡方統計確定最佳分割的決策樹分類方法。在形式上,CHAID非常直觀,它輸出的是一個樹狀的圖形[3]。它以因變量為根結點,對每個自變量進行分類,計算分類的卡方值。如果幾個變量的分類均顯著,則比較這些分類的顯著程度(P值的大?。缓筮x擇最顯著的分類法作為子節點。CHIAD可以自動歸并自變量中類別,使之顯著性達到最大。最后得到決策樹的每個葉結點就是一個細分組。可以說CHAID提供了一種在多個自變量中自動搜索能產生最大差異的變量方案。
1.分組步驟
利用SAS9.13軟件的Enterprise Miner(簡稱EM)進行分組[4]。具體操作步驟如下:
(1)新建數據挖掘項目
SAS的命令窗口輸入命令miner,進入數據挖掘窗口。并為新的數據項目更名為:DRGs Tree Node。
(2)建立輸入數據源結點
添加一個輸入數據源結點,為本次數據分析建立起數據源。增加一個Input Data Source結點,高血壓患者的住院總費用作為目標變量,合并癥和/或并發癥等級、年齡、性別和離院方式作為解釋變量。
(3)建立Data Partition結點
Data Partition結點主要將元數據分為訓練數據、驗證數據和測試數據。設置觀測值數據比例為70%,預測值數據比例為30%。
(4)建立Tree Node結點
Tree Node節點是進行決策樹分析的中心結點,對它的不同設置和操作將對數據集建立起不同的決策樹模型。將Tree從左側列表框拖入右側的工作平臺。建立Data Partition結點和Tree結點之間的連接。
通過上述步驟建立的決策樹數據分析過程包括以下三個結點Input Data Source、Data Partition以及決策樹結點。
(5)運行決策樹結點
在設置完成決策樹結點之后,關閉結點,在tree結點上右擊鼠標并選擇Run選項。
2.分組結果
通過SAS軟件的決策樹模型共得到6個高血壓的DRGs細分組,具體分組規則如下:(1)主要診斷為高血壓疾?。↖CD-10編碼為I10-I15),年齡≥82.5歲,男性;(2)主要診斷為高血壓疾?。↖CD-10編碼為I10-I15),年齡≥82.5歲,女性;(3)主要診斷為高血壓疾病(ICD-10編碼為I10-I15),77.5歲≤年齡<82.5歲,有重要的合并癥和/或并發癥;(4)主要診斷為高血壓疾病(ICD-10編碼為I10-I15),年齡<77.5歲,有重要的合并癥和/或并發癥;(5)主要診斷為高血壓疾?。↖CD-10編碼為I10-I15),年齡<82.5歲,有一般的合并癥和/或并發癥;(6)主要診斷為高血壓疾病(ICD-10編碼為I10-I15),年齡<82.5歲,無合并癥和/或并發癥。各組的情況如表1所示:

表1 高血壓患者DRGs分組結果
由表1可知,分成的6個組中例數最多的是第5組,例數是1022例,例數最少的是第2組,僅有13例;決定系數為0.28。
病案信息質量是影響本地區開展DRGs的分組研究的關鍵環節[5]。本課題組在探索用決策樹模型將高血壓這一個基本組分解為細分組的過程中,共剔除415例存在問題的病例,問題主要集中在主要診斷選擇不當,其次是臨床醫生在病案首頁中仍按照習慣方式書寫診斷,常冠以籠統的大范圍的疾病名稱,編碼人員也未能進行調整。因此建議醫保部門加強對醫療機構的病案質量的考核,加強編碼人員專業知識的學習和責任心的教育[6],加強病案質控工作。
疾病診斷相關分組的方法常用的有兩種:一種是以臨床專家對疾病的理解為基礎進行分類;一種是根據統計學方法,通過對大量數據進行統計分析進行分類[7]。本課題組選用的統計學的方法,用決定系數和變異系數分別來判斷高血壓患者的DRGs組間、組內的差異性,由上述的決定系數及變異系數可以看出利用決策樹進行DRGs分組在理論上可行。但是在四個解釋變量中,只有出離院方式沒有成為分組節點,可能是本次研究的樣本數量不夠大,或者醫院醫生在離院方式的填寫方面依舊存在問題。
本地區現階段實施醫療保險全病種的DRGs支付制度的條件還不夠成熟,本文統計分析顯示,所采用的統計方法是可行的,但是高血壓患者的DRGs組間、組內的差異性大,表現在結果的變異系數大而決定系數小,說明該地區的數據資料質量、可靠性以及臨床醫生的病案填寫質控都有待改進。在本地嘗試進行常見病的DRGs分組測算,將其結果作為對其中的常見病種醫療付費的標準參考,完善單病種支付;將DRGs中不同組的權重應用于制定醫?;鸬姆峙浞椒ê歪t院內部對各個科室的基金分配,以及應用于醫療機構服務績效的評價,因此,本地區開展DRGs的分組方法學探索具有重要意義。
1.陳自滿.我國醫療保險支付方式改革研究述評.南京醫科大學學報(社會科學版),2013,54(1):27-30.
2.吳易欣,沈曙銘,李力.口腔??漆t院開展DRGs應具備的條件初探.中國醫院,2013,17(1):51-52.
3.馬瑾,孫穎,劉尚輝.決策樹模型在住院2型糖尿病患者死因預測中的應用.中國衛生統計,2013,30(3):422-423.
4.魏鳳江,崔壯,李長平,等.決策樹模型與回歸模型在天津市某區公務員健康狀況分析中的應用與比較.中國衛生統計,2013,30(1):42-45.
5.李范,趙玉虹,何歡.我國DRGs研究的文獻計量分析.中國病案,2013,14(2):65-66.
6.張惠娟,陳佩貞.疾病診斷及其編碼的準確性是實施DRGs支付方式的關鍵.中醫藥管理雜志,2013,21(2):197-199.
7.鄭古崢玥,高建民,詹梅,等.陜西省某三級醫院住院病人疾病診斷相關組合分組方法研究.中國衛生經濟,2013,32(1):19-21.
(責任編輯:丁海龍)
1.石河子大學醫學院預防醫學系(832003)
2.石河子大學醫學院第一附屬醫院
△通信作者:馬利,E-mail:mali7273@aliyun.com