尹 悅,吳曉凡,王書平,娜地達·阿西木,閆麗娜
(1.中國醫師協會,北京 100071;2.北京大學第一醫院,北京 100132;3.新疆石河子大學醫學院,新疆 石河子 832003;4.國家衛生健康委衛生發展研究中心,北京 100032)
在醫學研究中,計數數據常會出現大量觀測值為零的現象,即數據過度離散,觀測值為零的占比遠超過其他數據的比例,導致傳統的統計分析模型分析出現誤差,如負二項回歸和泊松回歸無法準確預測其范圍[1]。針對該類型的數據分析,國內外學者提出零膨脹及相關回歸模型的理論,經實踐逐漸成為統計學上解決該類問題的主流方法之一[2-4]。當前對居民住院情況的研究,多聚焦于對住院率的分析,而未能重視住院次數潛在的含義[5],由于大部分居民一年內都是健康狀態無需住院,因此住院次數為零次的占絕大多數[6],故本研究引入泊松回歸、負二項回歸、零膨脹泊松回歸和零膨脹負二項回歸等4種模型,通過模型間的擬合對比,進一步探究山西省運城市居民住院次數的影響因素,為零膨脹及其相關回歸模型提供實證研究,為當地政府及相關部門規劃運城市醫療資源配置提供數據支持和科學依據。
本研究數據來源于“中國與世界衛生組織2020-2021雙年度合作項目”課題衛生服務調查數據庫,采用多階段分層隨機抽樣的方法,由國家衛健委衛生發展研究中心組織家庭入戶調查。本研究通過查閱住院影響因素的相關文獻[7-9],結合專家討論,自制問卷調查表,其內容主要包括:(1)個人基本特征:性別、年齡、婚姻狀況、文化程度、職業、是否患有慢性病;(2)家庭收入、家庭常住人口數;(3)居住區域、社會醫療保障情況、家庭醫生簽約情況;(4)健康知識獲取途徑、健康體檢、是否吸煙、飲酒情況、體育鍛煉。
調查組于2022年3月在運城市鹽湖區和萬榮縣2個區(縣)隨機抽取居民進行入戶調查,共獲得問卷6020份,最終獲得有效問卷5523份(有效率為91.74%)。
1.2.1 模型擬合
用EpiData 3.1建立數據庫,采用雙人錄入數據。運用StataMP 16.0軟件對調查問卷數據進行分析。對運城市居民的個人、家庭、社會、健康行為特征及住院次數進行描述性分析。利用軟件擬合負二項回歸、泊松回歸、零膨脹負二項回歸、零膨脹泊松回歸模型[10],并運用赤池信息準則(AIC)和貝葉斯信息準則(BIC)判斷模型的優劣,AIC/BIC值越小,認為模型的擬合度越高[11],以P<0.05為差異有統計學意義。
1.2.2 模型評價

(2)Vuong檢驗,又稱零膨脹檢驗,主要用于檢驗零膨脹、負二項回歸及Possion回歸等模型中頻數0的數量,篩選出最優的相關模型[12],其計算公式如下:

運城市居民基本特征分布情況見表1,年住院次數分布情況見表2。

表1 山西省運城市居民的基本特征分布(n=5523)

表2 山西省運城市居民年住院次數分布情況(n=5523)
5523名居民中過去一年發生住院情況的居民共計653人,存在應住院而未住院情況的共計 42 人,主要原因為:感覺病輕17人(40.48%),工作忙11人(16.42%),錢不夠9人(7.32%),無有效治療5人(2.11%)。
2.3.1 過離散檢驗
2.3.2 零膨脹檢驗
根據Vuong檢驗結果表明,擬合零膨脹Possion回歸模型和標準Possion回歸模型,其統計量值V=5.08;對于擬合零膨脹負二項回歸模型和標準負二項回歸模型,其統計量值V=4.34,P<0.001,表明該數據確實存在零膨脹現象,需進一步進行零膨脹擬合相關模型。
2.3.3 模型擬合指標比較
根據分析結果表明,零膨脹負二項回歸模型的對數似然值(LL)為-2076.661,在4種模型中最大;赤池信息準則值(AIC)/貝葉斯信息準則值(BIC),在4種模型中為最小,選擇零膨脹負二項回歸模型進一步分析居民住院次數。
以居民年住院次數為因變量,經零膨脹負二項回歸顯示:在計數過程中,性別、年齡、文化程度、家庭年均人收入、家庭常住人口數、居住區域、距離鄉鎮衛生院/社區衛生服務中心遠近、患有慢性病情況是運城市居民年住院次數的影響因素,其差異具有統計學意義。在零過程中,年齡、職業、家庭常住人口數、居住區域、距鄉鎮衛生院/社區衛生服務中心遠近、患有慢性病情況、健康知識獲取途徑、吸煙是運城市居民年住院次數產生零膨脹現象的影響因素(P<0.05),其差異具有統計學意義。見表3。

表3 山西省運城市居民年住院次數影響因素的零膨脹負二項分布情況
本研究通過“中國與世界衛生組織2020-2021雙年度合作項目”課題衛生服務調查數據開展實證研究,結合過離散檢驗和零膨脹檢驗結果,有理由認為家庭年人均收入處于中等水平、患有慢性病人群就醫行為較多;年齡偏大、家庭常住人口數為4~6人、城區居住、患有慢性病及經常吸煙的人群的住院潛在需求更大,并且居民年住院次數具有聚集性和零計數過多的特點。Poisson或負二項模型在分析居民住院次數的影響因素時,只能篩選出對住院及其頻次的影響因素,但不能將住院風險變化的影響因素與住院頻次變化的影響因素分辨開;零膨脹模型的logit部分可以篩選出是否選擇住院的影響因素,而Possion或負二項部分,可以體現影響住院頻次變化的因素。因此本研究以山西省運城市居民年住院頻次數據為例探討了零膨脹及相關回歸模型的應用,過離散檢驗結果表明居民年住院頻次更符合負二項分布,零膨脹檢驗結果表明數據存在零過多現象,具有過離散和零計數過多的特點[13]。結合對數似然值、AIC信息準則及BIC信息準則得出,零膨脹負二項回歸模型擬合該類型數據時不僅增加了模型擬合優度,同時明確了各因素在Logit部分或負二項部分中所起作用[14]。
依據最優模型的計數過程顯示,女性、年齡、大專及以上文化程度、家庭常住人口數為4~6人、在城區居住對居民年住院次數有負向影響;家庭年人均收入處于中等水平、患有慢性病對居民年住院次數有正向影響。
3.2.1 男性住院次數高于女性
相對于女性,男性的年住院次數更高,這與以中國CHARLS數據為代表研究得到性別差異結果相反[15],一方面根據調研結果表明,女性健康素養高于男性,該地區女性鍛煉率、健康體檢率及健康知識關注率均高于男性,且調研地區男性吸煙率遠高于女性,另一方面該調研地區經濟水平在全國處于偏低水準,普遍情況為女性經濟水平低于男性。由于經濟水平制約衛生服務利用的支付能力[16],大大降低了女性衛生服務利用的可能性,也是導致女性的住院次數低于男性的原因之一。同時本研究基于2022年調研數據,這一結果可能代表了近些年對女性健康關注后的一個階段性成果。
3.2.2 青少年兒童住院次數高于成年人
本研究發現青少年兒童的住院次數最多,其次為60歲以上的老年人。這與已有研究中,兒童年齡越小其衛生服務利用越高的結果一致[17],究其原因可能是由于年齡越小的兒童自身的抵抗力與免疫力也越差且家長對于兒童的健康狀況更重視。另一方面本研究中,60歲以上老人中患有慢性病及相關并發癥的居民達到70%以上,每年常規治療慢性病或因病情惡化導致并發癥等均會增加其住院次數[18],這與本研究中患有慢性病者住院次數越高這一結果的原因類似。另外,本次調研處于疫情期間,很多成年人在非必要住院的情況下選擇不住院,可能會對本文的分析造成一定程度的偏移。
3.2.3 家庭年人均收入中等及偏下的人群住院次數較高
家庭年人均收入位于中等及中等偏下水平的家庭年住院次數相對更高。一方面低收入人群多存在“小病不看、大病不治、重病才住院”的現象[19],另一方面中等偏高及高收入家庭相對住院次數更少,其原因主要由于該類人群或家庭接觸到的醫療資源相對更豐富,同時也具有較高的預防保健知識儲備,在一定程度上會更關注自身健康,可以做到對疾病的“早發現,早治療”,同樣文化程度大專及以上者相對于小學及以下者住院次數更少,與其原因類似,即對于住院的需求相對更少[20]。
3.2.4 家庭人口1~3人或7人以上家庭住院次數較高
據調研了解,該地區1~3人口的家庭,由于分家等原因大多只剩下老人,平均年齡為(56.05±18.16)歲;4~6人口的家庭則通常為老中少三代家庭,平均年齡為(38.94±21.47)歲;7人口及以上家庭多為分戶不分家家庭,平均年齡為(35.69±22.45)歲。因此1~3人或者7人及以上家庭由于老人及小孩占比較高,結合前面分析年齡對住院次數的影響,所以這兩類家庭住院次數也更多。
3.2.5 非城區居民住院次數高于城區居民
根據數據分析,居住在城區居民住院次數相對更低,一方面這可能與城區居民較年輕相關,經計算其平均年齡低于農村地區,而年輕人的健康基礎較好,衛生服務需求低于老年人。另一方面運城市鹽湖區城鎮化率為74.5%,處于較高水平,三級甲等、民營醫院及診所等各類醫療機構主要集中在城區,因此城區居民擁有較為便捷的就醫渠道且醫療資源質量更高,同時由于就醫及時而避免了病情遷延加重,最終多次住院的現象。
依據最優模型的零過程顯示,年齡、家庭常住人口數為4~6人、在城區居住、患有慢性病及經常吸煙對居民住院次數出現零膨脹現象有負向影響,職業、通過非醫療機構獲取健康知識對居民住院次數出現零膨脹現象有正向影響。
3.3.1 住院次數隨著居民年齡的增加呈正相關
以0~18歲少兒組為對照,隨著年齡增加,近一年住院次數為0的概率越小,表明居民身體各項機能隨著年齡升高逐漸退化,且對慢性病及急性病的抵抗能力越來越低,因此對于醫療的需求越來越高。這一結論與計數過程中“相對于0~18歲少兒組,高年齡組近一年住院次數更低”這一結論看似矛盾,但零過程主要用于推斷零過程出現的可能性,故年齡越高則出現住院次數為0的概率越低與0~18歲少兒組患病后住院次數更多兩者之間并不沖突。
3.3.2 住院次數隨著家庭人口數的增加呈正相關
研究發現,隨著家庭常住人口數增加,年住院次數為0的概率越低,這與上文計數過程提到的當地居民分戶不分家的地方特征相關,多人口家庭老人及兒童的占比較高,并且家庭中只要有一人患病則該家庭年住院次數即大于0。
3.3.3 住院次數隨著家庭人口數的增加呈正相關
本研究中,城區居住的居民年住院次數為0的概率更低,這可能與城區居民更關注自身健康有關,在疾病早期能做到及時就醫,雖然住院的概率更高,但其住院次數相對低于農村居民。
3.3.4 住院次數隨著居民慢性病數量的增加呈正相關
根據數據分析,患有慢性病者年住院次數為0的概率更低,這可能與慢性病病程較長有關,且有研究表明當前我國中老年人共病現象較為嚴重,慢性病數量的增加與衛生服務利用增加明顯相關[21],因此無需住院的概率必然降低。
3.3.5 住院次數隨著當地吸煙率的增加呈正相關
相對于不吸煙者,吸煙者住院次數為0的概率降低,已有研究表明吸煙與多種慢性疾病發病率呈正相關[22,23],根據調研情況當地吸煙率為25.43%,處于較高水平,故吸煙者住院次數大于0的概率更高。
3.3.6 住院次數隨著非醫療機構渠道健康知識獲取率的增加呈正相關
本研究中通過非醫療機構獲取健康知識的居民年住院次數為0的概率更高,本研究中非醫療機構主要指家人朋友科普、電視健康節目、微信公眾號、短視頻軟件等,由于通過非醫療機構可能在一定的專業性偏差,側面反應了通過醫療機構對居民開展健康教育及知識普及尚有較大的改善空間。本研究中是否簽約家庭醫生對居民是否住院并無統計學意義同樣驗證該觀點,已有研究表明簽約家庭醫生能夠提高居民住院服務利用水平[24],因此應提高家庭醫生與居民之間的健康信息交流與聯系。
對于現階段醫療衛生服務體系,改善居民住院就醫習慣、降低居民住院行為發生最基本的要求是獲得應有的醫療技術服務,并在特定環境的醫療技術水平下,使疾病療效得到應有保障,即“看得好病”,延伸是人文關懷、貼心的服務。一方面,將服務落腳在改善就醫感受上,服務不僅是符合醫療路徑、診療規范,而要注重群眾的就醫體驗,最終將群眾的期望感受和實際獲得的感受匹配起來,而不是單純追求技術質量。通過整體化服務,使預防、治療、康復、護理等服務整合起來,從患者的心理、社會等多層面進行考慮,提升患者的身心社會適應程度。另一方面,將提供的間斷性服務拓展為延續性、責任制管理。對于越來越多的老齡性疾病來講,防和治是融合的,具體而言要抓好抓實家庭醫生簽約服務,合理結合信息化技術,使短暫的服務變為責任制的、連續的長期關系。