周立業,夏鑫婧,郭志飛,孫夢姣,余紅梅
·綜合研究·
山西省某醫院腦卒中病人住院費用的影響因素
周立業,夏鑫婧,郭志飛,孫夢姣,余紅梅*
山西醫科大學,山西 030600
:分析腦卒中住院費用的分布情況及影響因素,探尋高效的分析方法,為合理控制腦卒中住院費用提供理論依據。:收集山西省某三級甲等醫院2017年—2019年腦卒中病人的住院信息,基于隨機森林、支持向量機、Logistic回歸3種機器學習算法建立預測模型,分析住院費用影響因素及其重要程度。:腦卒中病人藥品費在住院費用中占比較大,住院天數、腦卒中分型、科室為腦卒中病人住院費用的主要影響因素。基于支持向量機算法構建的腦卒中病人住院費用預測模型性能較優。:應通過綜合措施控制腦卒中病人住院費用,以減少住院天數為重點,強化對可控因素的管理,針對關鍵人群采取預防和控制措施,降低腦卒中病人的經濟負擔。
腦卒中;住院費用;疾病負擔;影響因素;機器學習
腦卒中是一種高患病率、高死亡率、高致殘率、高復發率和高經濟負擔五大特點的慢性病[1?2],是我國成年人死亡和殘疾的首位病因,嚴重影響病人的生存質量[3]。據推算,我國心血管病現患人數3.3億例,其中腦卒中病人1 300萬例[4]。全球疾病負擔(global burden of disease,GBD)結果顯示,2016年我國因腦卒中死亡179.0萬人,造成的傷殘調整壽命年(disability adjusted life year,DALY)達3 862.3萬人年[5]。我國每年的腦卒中社會經濟負擔達400億元人民幣,直接經濟負擔為每年243億元人民幣[6],給社會及家庭帶來沉重的疾病負擔。了解腦卒中的流行病學分布可以為腦卒中的防治工作提供重要的理論支撐。近年來,隨著機器學習算法的發展,越來越多的學者開始將機器學習算法應用于醫療費用分析中[7?8],決策樹、隨機森林(RF)、支持向量機(SVM)等是使用較為廣泛的機器學習算法,但其中較少應用多種機器學習算法進行對比檢驗。目前,由于沒有具體標準劃分住院費用的高低,許多研究人員根據主觀看法劃分住院費用,還有研究人員使用中位數方法將總住院費用分為兩類。而聚類法對住院費用的分類比中位數法更好,而且不同數據類別之間的分界點完全不受中位數大小的影響[9]。因此,選擇K?Means聚類法對住院費用進行分類,盡可能地避免人為因素的干擾。本研究以山西省運城市某三級甲等醫院2017年—2019年腦卒中住院病人為研究對象,對腦卒中入院特征和住院費用進行針對性的分析,對腦卒中住院費用的影響因素進行探究,對于不同模型中篩選出的影響因素進行重要性排序,從而找出最重要的影響因素,旨在為腦卒中防治和減少疾病負擔提供實證分析依據。
1.1資料來源數據來源于山西省某三級甲等醫院2017年1月—2019年12月全年住院病人中疾病診斷編碼為I60~I64開頭的病人2 042例,收集腦卒中住院檔案首頁的關鍵信息,包括社會人口學特征(住院號、性別、年齡、婚姻狀況、職業等)、臨床特征(門診診斷名稱、住院天數、藥物過敏等)、醫療付費方式、總費用以及各項醫療服務費用(藥品費、治療費、護理費、檢查費、衛生材料費等)等。為保證研究數據的準確性,使分析結果更真實、可靠,對數據進行了預處理,剔除存在重要變量缺項、漏項以及有邏輯錯誤的病例,剔除極端值,如住院總費用低于100元或超過均數±3個標準差范圍的病例,剔除病案質量為乙、丙或空缺的病例。
1.2研究方法
1.2.1統計分析方法運用SPSS 24.0軟件進行統計學分析。對住院費用進行正態性分析,發現其呈偏態分布,因此對連續型變量采用Spearman秩相關分析進行單因素分析,對分類變量采用非參數檢驗(Mann?Whitney檢驗、Kruskal?Wallis檢驗)。運用R軟件建立隨機森林、支持向量機、Logistic回歸模型。
1.2.2模型的構建與評價指標選用3種應用較為廣泛的機器學習算法,即隨機森林、支持向量機和Logistic回歸,比較3種分類算法基于已有變量信息對腦卒中住院費用高低的分類。為了比較3種分類算法的分類效果,采用分層抽樣,選擇低費用組和高費用組70%的樣本作為訓練集建立模型,其余30%樣本作為測試集評估模型性能。將3種方法在同一訓練集上構建分類預測模型,并利用測試集數據進行預測,探究不同模型中住院費用影響因素排序的差異。通過靈敏度、特異度、準確度、受試者工作特征曲線下面積(AUC)和G?means對模型性能進行評價。
1.2.3變量離散化處理采用K?means聚類法將因變量(冠心病住院費用)分為低費用組和高費用組(低費用組=0,高費用組=1),將年齡、住院次數和住院天數進行離散化處理,見表1。

表1 腦卒中住院費用影響因素的變量賦值情況
2.1腦卒中病人住院費用的基本構成本研究涵蓋2017年—2019年數據,為了減少居民消費價格指數(consumer price index,CPI)帶來的影響,根據中國國家統計局發布的CPI指數對費用進行調整,3年的CPI指數分別是101.6,102.1和102.9。腦卒中病人次均住院費用中位數為20 430.55元,其中藥品費和衛生材料費所占比例排在前2位,分別占總費用的47.15%和14.75%,詳見表2。

表2 2017年—2019年腦卒中病人次均住院費用情況(M)
2.2腦卒中病人住院費用影響因素的單因素分析(見表3)

表3 腦卒中病人住院費用影響因素的單因素分析(n=2 042)
2.3K?Means聚類過程及結果(見表4)

表4 腦卒中病人總住院費用K?means聚類結果 單位:元
2.4腦卒中病人住院費用影響因素的統計模型擬合結果在K?means聚類的基礎上,將單因素分析中篩選的13個自變量納入Logistic回歸模型、隨機森林和支持向量機模型。變量中包括4個二分類變量、9個多分類變量,處理時將9個多分類變量轉化成啞變量,采用二元Logistic回歸模型進行分析預測。隨機森林模型的建立主要取決于兩個重要參數:mtry(隨機選擇特征的數目)和ntree(樹的數目)[8]。經驗證,本研究中參數mtry設置為4,ntree設置為1 000時,隨機森林模型表現最佳。在解決樣本量較少,同時又是非線性的高維數據的分類問題時,支持向量機模型較其他模型更有優勢,表現出預測精度較高的優點。針對不同特征的數據集選擇適宜的核函數,適當的數據預處理以及選擇最優的參數,都可以極大地改善支持向量機的性能。經驗證,在本研究選擇sigmoid核函數,將gamma的值設為0.01,cost的值設為100,此時模型分類效果更優秀。比較3個模型的輸出結果,發現腦卒中住院費用影響因素的重要性排序在不同模型中存在差異:住院天數在3個模型中次序一致,腦卒中分型、是否手術、科室、職業、年份、付費方式、藥品零加成政策前后在3個模型中次序基本一致,而科室是否一致、年齡、性別、入院途徑、住院次數在3個模型中次序不一致。詳見表5。

表5 腦卒中病人住院費用影響因素的統計模型擬合排序結果
2.53種模型性能比較采用同一訓練集構建隨機森林、支持向量機、Logistic回歸的腦卒中住院費用預測模型,應用于同一測試集數據,比較各模型的預測效果,詳見表6。
3.1支持向量機模型的綜合性能優于其他2種模型本研究結果表明,隨機森林模型和支持向量機模型比傳統Logistic回歸模型性能更優,隨機森林模型的特異度最高(93.81%),支持向量機模型靈敏度、G?means及AUC表現最好。在以往的大多醫療費用研究中,學者們較多選擇多元回歸分析等傳統統計方法,但這類統計方法都有著嚴格的應用條件,如線性、獨立、正態、方差一致性。醫療數據的復雜性和高維性等特點,使其很難達到正態性、方差一致性等要求,在多元線性回歸等傳統方法中引入偏態數據,較大可能得出錯誤結論。支持向量機是近年來基于統計理論和結構風險最小化原則而開發的一種機器學習算法,對數據要求較少,可以很好地處理高維和復雜的資料,如醫療數據,同時還具備較好的泛化能力,其模型的建立是一個核函數和最佳參數選擇的過程,適宜的核函數選擇和參數的優化能夠顯著提高預測精度[10]。本研究結果證實,支持向量機對住院費用的建模分類和預測具有有效性和適用性,且分類效率高,模型穩定性強,在醫療領域有較好的推廣前景和發展空間。
3.2藥品零加成政策小有成效,但結構合理性仍需加強本研究結果顯示,藥品費呈現逐年小幅下降趨勢,這與國家的藥品政策密不可分。2017年7月山西省公立醫院實行藥品零加成政策,降低藥品費用得到有力的政策支持。但藥品費在腦卒中住院費用中占比仍然最高,與其他學者研究結果[11]相似,高于國外水平[12]。另外,治療費3年年均占比約12%,護理費年均占比約5%,遠低于藥品費占比,且治療費和護理費呈逐年下降趨勢,這與公立醫院的改革方向不一致,可從側面反映出技術服務的價值認可度不高,醫務人員勞動價值未能充分體現,費用結構不合理,急需探索降低藥費比重、合理用藥的措施,應在控制住院總費用和藥品費的基礎上繼續降低藥占比,避免增加醫療經濟負擔。同時,需要進一步完善補償機制,提高技術勞務收費的比重,保障醫務人員的合理收入,使其在醫療行為中的貢獻真正得到體現。本研究結果還發現,3年間檢查費在占比與數值均有所上升,與陳積標等[13]研究結果類似。提示醫院管理者應當在運營管理上實現透明化、信息化,做好醫院內部的成本管控,從粗放管理轉為精細化管理[14],制定措施規范檢查和診療方案,避免出現由“以藥養醫”轉換為“以檢驗、衛生材料養醫”的現象,進一步保障參保利益,提高老百姓的獲得感[15]。
3.3腦卒中病人住院費用的影響因素本研究選用單因素分析篩選出的變量建立隨機森林、支持向量機、Logistic回歸模型,對影響因素進行重要程度排序,共13個變量被引入模型,可大致分為3類不同特征因素:客觀因素(年份、藥品零加成政策前后)、個體因素(性別、年齡、職業、付費方式、入院途徑、腦卒中分型)以及臨床因素(住院天數、住院次數、科室、科室是否一致、是否手術)。個體因素大多取決于自身情況及主觀意愿,其中對于住院費用影響較大的為腦卒中分型。出血性腦卒中病情兇險且常伴有意識障礙,出血量大于30 mL時需采取手術治療[16],術后長期康復治療以及可能發生并發癥(腦室出血伴腦積水、靜脈血栓形成等),同時還伴隨住院天數的增加,都是造成費用增高的原因,加重了個人及家庭的經濟負擔。職業在影響因素中的排名也較為靠前,本研究數據來源于運城市三級甲等綜合型醫院,數量較多且全面,數據分析也具有較好的代表性。根據職業分布來看,農民和工人占75.6%,且這類人群的次均住院費用高于其他職業。這類人群的工作生活環境存在較多的危險因素,如忽視自身保健、長期體力勞動等,他們普遍缺乏健康意識,對于基層衛生服務的利用率不高,部分社區或鄉鎮衛生院的衛生服務可及性也有所缺乏[17],長期積累導致病情加重,一定程度上增加了醫療支出。提示醫療機構可以依據本院就診人群的分布特征采取針對性的措施,加強與社區服務中心、鄉鎮衛生院的聯動合作,依據早診早治的方針,深入鄉鎮,安排專家開展專題講座,定期組織巡診義診等。同時,當地衛生部門也要因地制宜,統籌規劃好各級醫療機構的職責,對于腦卒中這類慢性病,需要充分發揮社區衛生中心在腦卒中防治中的作用,加強慢性病的一級、二級預防工作,立足社區,做好重點人群的健康管理、健康教育工作,加大對基層護理人員的培訓力度,更好地指導重點人群熟悉日常保健措施以及掌握疾病的應急處理措施,盡可能地減少出血性腦卒中這類危急病情的發生,最大限度地保護群眾生命健康。
醫療因素中各因素排名均較靠前,其中住院天數排第1位,與王婷婷等[18?19]研究結果一致。有研究表明,將三級醫院的平均住院日從20 d減少到7 d,可以降低49%的住院費用[20]。住院天數的不必要延長,例如等待檢查或手術的住院天數,都會伴隨著護理、診查、床位等費用的增加,可能導致住院總費用上升。醫療機構應當采取綜合性的措施提高臨床科室和檢查科室之間的有效配合,合理減少住院天數,長期住院會增加醫院感染和并發癥的風險,病情反復,遷延不愈。另外,腦卒中這類慢性病的特征決定了大部分病人出院后都要進行一段時間的康復治療,康復治療可以在一級、二級醫院或社區、鄉鎮衛生服務中心完成,體現出分級診療的重要性,需要上級醫院與下級醫療機構保持良好的配合和溝通,上級醫院把控好出院指標,下級醫院做好護理、康復的配套工作,不僅可以減輕病人的經濟負擔,同時也加快了三級醫院的病床周轉率,緩解病床緊張現象,提高資源利用效率。
[1] 趙慶,吳茜,孫曉,等.腦卒中患者延續性護理質量評價指標體系的構建[J].中華護理雜志,2020,55(2):171-176.
[2] 費囡.腦卒中再住院患者病恥感對健康促進生活方式的影響研究[J].中國醫院統計,2020,27(1):55-58;63.
[3] 王隴德,劉建民,楊弋,等.我國腦卒中防治仍面臨巨大挑戰——《中國腦卒中防治報告2018》概要[J].中國循環雜志,2019,34(2):105-119.
[4] 中國心血管健康與疾病報告編寫組.中國心血管健康與疾病報告2020概要[J].中國循環雜志,2021,36(6):521-545.
[5] GBD Causes of Death Collaborators.Global,regional,and national age-sex specific mortality for 264 causes of death,1980-2016:a systematic analysis for the Global Burden of Disease Study 2016[J].Lancet,2017,390(10100):1151-1210.
[6] 吳亞哲,陳偉偉.中國腦卒中流行概況[J].心腦血管病防治,2016,16(6):410-414.
[7] 高峰,鄭二維,張清芝,等.基于決策樹模型腦卒中患者住院費用DRG分組實證研究[J].中國衛生經濟,2020,39(4):33-35.
[8] 于大海,李金,羅艷虹,等.隨機森林模型和決策樹模型在肝硬化上消化道出血預后中的應用[J].中國衛生統計,2019,36(2):162-166.
[9] YAN X,CHOWDHURY N A.Mid-term electricity market clearing price forecasting:a multiple SVM approach[J].International Journal of Electrical Power & Energy Systems,2014,58:206-214.
[10] 王婭玲,張鐸齡,張譯丹,等.多種統計模型在冠心病醫療費用影響因素中的應用與比較[J].中國衛生事業管理,2017,34(3):198-200;204.
[11] 錢治軍,趙艷芳,何倩,等.上海市6所三級甲等醫院腦卒中住院患者費用分析[J].解放軍醫院管理雜志,2014,21(10):978-980.
[12] YONEDA Y,UEHARA T,YAMASAKI H,.Hospital-based study of the care and cost of acute ischemic stroke in Japan[J].Stroke,2003,34(3):718-724.
[13] 陳積標,況杰,易應萍,等.2015—2019年江西省缺血性腦卒中患者特征及住院費用分析[J].現代預防醫學,2021,48(8):1515-1519.
[14] 王俊嬌,夏敬軒.公立醫院管理信息化探索與研究[J].中國管理信息化,2020,23(18):97-98.
[15] 王予,徐沛瑤,朱敏.高血壓患者住院費用及其影響因素研究[J].中國衛生統計,2019,36(4):574-577.
[16] 陳若青,馬再鴻,王漫云.腦卒中首發病人住院費用分析[J].中國衛生經濟,2008,27(11):52-54.
[17] 馬婧,徐愛軍.四種基本醫療保險制度下高血壓患者衛生服務利用狀況研究[J].中國全科醫學,2018,21(28):3518-3522.
[18] 王婷婷,于麗華,郎婧婧,等.基于結構方程模型的肺癌手術患者住院費用影響因素分析[J].中國衛生經濟,2019,38(6):61-63.
[19] 譚禮萍,吳曉云,鄭銀雄,等.腦卒中患者住院費用影響因素的通徑分析[J].中國衛生統計,2012,29(4):574-575.
[20] WEI J W,HEELEY E L,JAN S,.Variations and determinants of hospital costs for acute stroke in China[J].PLoS One,2010,5(9):e13041.
Influencing factors of hospitalization costs of stroke patients in a hospital in Shanxi province
ZHOULiye, XIAXinjing, GUOZhifei, SUNMengjiao, YUHongmei
Shanxi Medical University, Shanxi 030600 China
stroke; hospitalization costs; disease burden; influencing factors; machine learning

YU Hongmei, E?mail: yu@sxmu.edu.cn
10.12102/j.issn.1009-6493.2023.03.025
國家自然科學基金項目,編號:81973154
周立業,副教授,博士
余紅梅,E?mail:yu@sxmu.edu.cn
周立業,夏鑫婧,郭志飛,等.山西省某醫院腦卒中病人住院費用的影響因素[J].護理研究,2023,37(3):517?521.
(收稿日期:2022-04-02;修回日期:2023-01-18)
(本文編輯 蘇琳)