馬喜民,李培雯,賀嘉慧,李春生,喬 慧
1寧夏醫科大學公共衛生學院流行病與衛生統計學系,寧夏銀川,750004;2寧夏環境因素與慢性病控制重點實驗室,寧夏銀川,750004
在經濟平穩增長、科技蓬勃發展的時代背景下,我國居民生活水平逐步提高,期望壽命也高于以往。與此同時,我國老年人口占總人口的比重逐漸增加[1],截至2021年,65歲以上人口已經突破2億,占總人口的比重達到14.2%[2]。在我國,年齡達到45歲已經入中老年階段,老齡化程度的加深,使人們對于疾病的抵抗能力變得薄弱,人群慢性病患病率出現顯著增長,并給衛生體系帶來沉重的壓力[3-4]。由于中老年患者身體健康狀況較差,患病風險高,對住院服務有較高的需求。因此,全面了解影響中老年患者衛生服務利用的現狀,可以針對性地減少因身體疾病造成醫療費用支出而導致的家庭經濟負擔,對于我國鞏固脫貧攻堅成果,阻止因病致貧、返貧具有重要意義。
目前,國內有較多關于住院費用的研究[5-9],在研究對象方面,許多學者針對的是不同地區三甲醫院中某些特定疾病的患者,很少聚焦于寧夏南部偏遠山區的農村中老年患者;在研究方法上,目前大多研究仍采用單一水平回歸模型分析住院費用影響因素[5-9],鮮有研究涉及不同水平結合決策樹模型對住院費用的影響因素分析,對分析住院費用的影響因素具有局限性。基于此,本研究在我國脫貧攻堅取得重大勝利的背景下,以寧夏南部山區的農村中老年患者為研究對象,采用分位數回歸模型探究寧夏南部山區農村中老年患者住院費用的影響因素,在此基礎上,結合卡方自交互偵測決策樹模型構建住院費用分組模型,預測各因素共同作用對住院費用的風險高低,為完善中西部地區醫療保險制度,提高寧夏南部山區農村中老年患者健康水平提供參考。
資料來源于寧夏醫科大學公共衛生學院團隊立項的國家自然科學基金項目與哈佛大學合作開展的試點項目2019年隨訪數據。采用多階段抽樣方法對寧夏海原、鹽池、彭陽、西吉4個縣進行抽樣調查。第1階段:將4個縣53個鄉鎮下的208個行政村按照經濟發展水平分為好、中、差3個水平。第 2 階段:對每個鄉鎮的行政村通過簡單隨機抽樣方法抽取40%作為樣本村,簡單隨機抽樣通過隨機數表法抽取,將208個行政村編排號碼為1-208;從隨機數表中任一數字開始,按一定的順序或間隔讀數,選取編號范圍內的數字,超出范圍的數字不選,重復的數字不再選,直至抽取數量至40%的行政村為止,簡單隨機抽樣方法則為結束。第 3階段:每個樣本村再通過系統抽樣每隔5戶抽取1戶家庭,共隨機抽取 20-33 戶居民,選取在家常住 1年以上,年齡≥45歲且過去1年有住院經歷的人作為調查對象。共選取調查對象1867人,發放問卷1867份,回收1867份,考慮到關鍵變量缺失,最終納入分析1802名,問卷有效回收1802份,問卷有效應答率96.5%。
研究自2009年開始基線調查,至2019年為第5次隨訪調查,由于前4次隨訪調查的數據分析顯示問卷均具有良好的信效度,因此本研究延續之前調查自行編制的問卷,并由專家對問卷內容進行質量檢驗,自制問卷量表Cronbach's alpha=0.853, KMO=0.846, Bartlett's球形檢驗P<0.001,信效度良好。調查內容包括性別、年齡、婚姻狀況、文化程度、職業、繳費方式、是否做手術、住院天數、住院次數、過去1年是否患有經醫生診斷的慢性疾病、過去1年因住院所支出的自付醫療費用。
1.3.1 分位數回歸模型。是一種基于因變量y分布來擬合自變量x的回歸方法。相較于單一水平回歸,分位數回歸可以選取任一分位數點進行參數估計,所以全面描述y|x的分布[10]。故采用分位數回歸模型,模型可簡要表述如下:
Y(τ)i∣(X=Xi)=β0(τ)+β1(τ)iX1i+β2(τ)iX2i+…+βm(τ)iXmi+ε(τ)i
式中,τ表示因變量Y的第τ分位數,0<τ<1;i代表觀測的編號,i=1,2,…n;0代表常數項;“1,2…m”代表自變量的個數。當擬做多因素分析的原始數據中的定量變量為偏態分布或存在一定比例的異常值時,可以嘗試采用分位數回歸方法構建模型進行分析[11]。
1.3.2 CHAID(Chi-squared automatic interaction detector)決策樹模型。 其核心思想是根據因變量和具有統計學意義的自變量進行最優分割,按檢驗結果進行最優分組[12]。參考以往決策樹模型,分別選擇父節點200,子節點100的個案數[13-14]。
使用Stata 16.0和SPSS 26.0進行數據分析,例數和構成比進行描述性分析,單因素分析采用秩和檢驗,多因素采用OLS回歸和分位數回歸,CHAID決策樹模型中建立住院費用分組模型。檢驗水準α=0.05。變量及賦值見表1。

表1 研究變量名稱及賦值情況
1802名寧夏南部山區農村中老年患者中,年齡60-74歲占比最高,有744例(41.3%);患有慢性病占比最高,有1298例(72.0%);未做過手術的占比最高,有1412例(78.4%);醫院直接報銷占比最高,有1015例(56.3%);住院天數在0-9天的居多,有805例(44.7%)。單因素結果顯示,不同寧夏南部山區農村中老年患者的住院費用在年齡(H=11.944,P=0.003)、慢性病患病(W=-2.063,P=0.039)、是否手術(W=-10.998,P<0.001)、繳費方式(W=-5.124,P<0.001)、住院天數(H=144.839,P<0.001)之間,差異具有統計學意義。見表2。

表2 寧夏南部山區農村中老年患者基本特征
2.2.1 OLS回歸模型。以住院費用為因變量,將表1變量賦值中的10個變量納入自變量進行OLS回歸,結果顯示,手術(β=-6359.841,P<0.001)、繳費方式(β=1686.032,P<0.001)和住院天數(β=4299.840,P<0.001)是住院費用的影響因素。見表3。

表3 寧夏南部山區農村中老年患者住院費用OLS回歸與分位數回歸比較分析
2.2.2 分位數回歸模型。在OLS回歸基礎上,將以上自變量納入建立P10、P25、P50、P75和P90分位數回歸模型進行住院費用影響因素分析。結果顯示,以住院天數在0-10為參照,住院天數在15天以上在P10、P25、P50、P75和P90五個分位數點上均產生了顯著的正向作用(β1=509.286,P1<0.001;β2=393.333,P<0.001;β3=585.714,P<0.001;β4=2800.000,P<0.001;β5=7700.000,P<0.001);以做手術為參照,未做手術在P10、P50、P75和P90分位數點上有顯著負向影響(β1=-434.286,P1<0.001;β3=-828.571,P<0.001;β4=-4000.000,P<0.001;β5=-12200.000,P<0.001)。以先墊付后報銷為參照,醫院直接報銷在P10分位數點有顯著負向影響(β1=-157.857,P1<0.00),在P50、P75和P90分位數點上有顯著正向影響(β3=485.300,P<0.001;β4=1300.000,P<0.001;β5=1866.667,P<0.1)。此外,以務農為參照,務工在P75分位數點有顯著影響(β4=1400.000,P4<0.05)。
分組模型顯示,住院費用最高的是做過手術并且住院天數在10-14天同時繳費方式為醫院直接報銷的寧夏南部山區農村中老年患者,住院費用最低的是未做過手術同時住院天數為0-9天的寧夏南部山區農村中老年患者。不同組合費用間差異有統計學意義(P<0.001),預測風險分值為0.083。見圖1。

圖1 基于決策樹模型構建的寧夏南部山區農村中老年患者住院費用分組模型
通過分位數回歸對住院費用的影響因素研究,得到了P10、P25、P50、P75和P90分位數下的回歸模型。結果顯示,住院天數是住院費用的關鍵因素。住院天數多和做過手術的患者在P10、P25、P50、P75和P90分位數點上均對住院總費用具有顯著正向影響。住院天數是反應醫療質量的指標[15],住院天數的增加伴隨著醫藥費、床位費和藥品等耗材費用的增加[16]。一方面,住院天數往往與患者疾病嚴重程度有關[17],嚴重的疾病治愈難度大且治愈時間長,即使病情緩解后也需要一定的康復時間,因此其住院天數增多,對住院費用影響較大;另一方面,由于研究面向寧夏回族自治區南部山區農村中老年患者,該地區因地理位置偏遠,經濟水平和醫療資源也較其他西部農村地區更為低下,當地居民患病后往往易忽視自身健康,在寧夏南部山區,“小病不看、大病不治、重病才住院”的現象較為常見[18],因此寧夏南部山區住院的患者病情更為嚴重,住院天數也會增多。是否手術是住院費用的關鍵因素。復雜的手術類型具有一定風險[19], 寧夏南部山區的農村中老年住院患者,由于個人健康意識較為薄弱,“小病拖,大病扛”較普遍,住院前身體就有一定的基礎病,術后身體更處于虛弱欠佳狀態,若術后恢復效果不佳,可導致病情反復,遷延不愈,都會導致住院費用的增加[20]。對此,醫療機構應根據病種標準和診療程序,對于風險較大的手術治療,建議采取保守治療的方式,減少不必要的手術。
結果顯示,住院費用也受到繳費方式的影響。通過分位數回歸進一步發現,在不同分位數點下,影響因素正負作用有所不同,在低分位數點上,醫院直接報銷的繳費方式對住院費用具有負向影響,而在高分位數點上,醫院直接報銷住院費用具有正向影響。究其原因,可能是因為醫院對于住院費用的報銷比例,低住院費用在醫院的封頂線內,可以滿足一定的報銷比例[21],因此醫院直接報銷的方式可以緩解住院費用負擔,當住院費用高于醫院報銷的封頂線時,超過封頂線的部分醫療費用無法報銷,因此醫院直接報銷的繳費方式住院費用高分位數點上無法緩解醫療負擔,這就提示政府部門既要繼續完善醫療保險制度,根據當地衛生服務利用現狀適當調整醫院的起付線以及封頂線,加大住院費用報銷比例,減少因重大疾病帶來的經濟損失。此外,通過以上分析,注意到職業為務工的患者在P75住院費用分位數點上顯著高于務農的患者。其原因可能為:在寧夏回族自治區南部山區,由于地理位置偏遠和經濟水平低下等原因,為維持家庭生計,部分人選擇外出務工。對于務工人員,長期外出打工造成居無定所,身體出現輕微疾病容易自身忽視,長期以來疾病累計造成身體出現惡化,因重大疾病造成了醫療負擔較重,因此住院費用較高,而務農的患者大多時間居住在家中,身體出現小病可就近去基層醫療機構治療,衛生服務可及性高,及時就近治療可減緩疾病發展,疾病嚴重程度相對較低,因此住院經濟負擔較低于務工的患者。對此,當地基層衛生人員應重點對外出務工家庭的人開展健康知識科普,提高對外出務工人員健康意識;政府部門也針對此現狀調整衛生政策,對外出務工等流動人員在醫療服務利用方面給予重點關注。
傳統單一水平回歸分析容易導致某些信息難以被發現。相比于傳統的回歸分析方法,分位數回歸結果可以估計住院費用的總體條件分布,使用分位數回歸估計結果更為穩健[22]。在本研究中,除傳統OLS回歸分析顯示的影響因素外,分位數結果還提示職業在P75水平的住院費用中產生了一定程度的影響。較傳統單一水平回歸,分位數回歸能描述因變量與自變量在不同水平間的關系,因此估計結果更加全面、穩健,對政策完善更具指導意義。
最終選擇在分位數回歸分析基礎上,納入有統計學意義的變量(職業、是否做手術、繳費方式、住院天數)進行住院費用分組分析。結果顯示,是否手術、繳費方式、住院天數進入了決策樹分組模型。研究構建寧夏南部山區農村中老年患者住院費用決策樹分組模型預測風險較低,根據費用分組模型結果,對制定有針對性的改進措施提供指導意義,幫助減輕寧夏南部山區農村中老年患者疾病經濟負擔的同時,也為完善醫保支付標準提供參考價值。