謝世堂 周海迎 何 靜 戴力輝△
數據分析與信息提煉在現代醫院的運營管理中具有重要作用。醫院管理者往往希望通過對醫院以往各項運營指標數據的統計分析與提煉,獲得各指標間相互作用、相互影響的數量關系,作為其制定各項管理目標的依據。醫院綜合目標管理涉及醫療、教育、科研、醫保等眾多子目標,而與各子目標相關的醫院運營指標則信息更為豐富,如何通過恰當的數理統計方法,將與各管理目標相關的眾多指標的數量關系提煉出來,是統計方法在醫院管理中應用的一項重要課題。目前,主成分回歸在醫院管理中應用的研究報道非常少見,本文通過實例探討如何利用該方法來實現指標間數量關系的建立及其模型在醫院管理上的應用。
文章以某三甲醫院的25個月的出院人次、門診診次、平均住院日、床位使用率、床位數、醫護人數數據為例,闡述主成分回歸在醫院目標管理中的應用思路。
在醫療指標中,出院人次是醫院主要的醫療產出指標之一,其大小受到醫院規模指標、服務人群指標、資源效率指標的影響。本文以出院人次Y為應變量,實際開放床位數X1、醫護人數X2、門診診次X3、平均住院日X4、床位使用率X5為自變量,通過線性回歸分析來解釋各指標間的相關性及關聯程度。
對變量Y、X1~X5通過SPSS 13.0做相關分析,結果如表1所示。
Y與X1-X5都相關且有統計學意義。但X1~X4之間也存在相關性且有統計學意義,X3與X5存在相關性且有統計學意義。提示自變量間可能存在多元共線性。
當經典的多元線性回歸無法提煉具有共線性的醫療指標的管理信息時,引入相對復雜的主成分回歸便是一種選擇。通過引進主成分分析來將相互關聯的多個變量化成幾個互不相關的綜合變量,再以主成分為自變量與應變量建立回歸方程,形成主成分回歸分析〔1〕。這樣,在保留了原自變量信息的同時,既減少了回歸分析中自變量的個數,而且作為自變量的各主成分互不相關,保證了回歸方程的穩定性。

表1 變量間的相關系數
自變量X1~X5之間相關,采用主成分分析,提取包含主要信息的主成分。
如表2所示,主成分1、2已包含了自變量X1~X5的主要原始數據信息,其貢獻率分別為59.644%、27.553%,主成分1、2的累積貢獻率為87.197%。

表2 主成分方差貢獻率和累計貢獻率
分析得到第一主成分、第二主成分與標準化后自變量之間的函數關系。第一主成分Z1=0.805X1+0.860X2+0.812X3-0.904X4+0.345X5;第二主成分Z2=-0.467X1-0.156X2+0.503X3+0.235X4+0.910X5(主成分表達式中X1-X5是原始指標通過公
為了方便計算主成分,將主成分表達式的標準化自變量替換成原始自變量。分別求出X1~X5的均數和標準差,如表3所示。
將原始自變量代入主成分表達式后,第一主成分Z1=0.04828165X1+0.00982509X2+0.00005023X3-0.84644194X4+0.03716471X5-57.00091054;第二主成分 Z2=-0.0280093X1-0.00178223X2+0.00003112X3+0.22003745X4+0.09802865X5+13.45279431。經過代入原始自變量的主成分表達式,在引入自變量數據后得到第一主成分Z1、第二主成分Z2的數據。
經過以上主成分分析后,在基本保留原數據信息的前提下,將5個具有一定相關性的自變量(X1~X5)降為2個相互獨立主成分(Z1、Z2),這就為多元線性回歸分析奠定了基礎。
(2)主成分回歸的建立
在主成分分析后,就應變量出院人次Y、主成分Z1、Z2進行多元線性回歸擬合。出院人次不服的正態分布,將Y進行對數變換后的lgY為應變量,模型擬合效果更好,見表4。

表4 模型評價參數
模型的殘差的標準差為0.022,提示模型預測的穩定性較好,該值越小則反映模型預測應變量的效果越好〔2〕。
對于該模型,F=113.155,P<0.001。說明至少一個自變量的回歸系數不為0,所建立的回歸模型有統計學意義。
對偏回歸系數的檢驗如表5所示。

表5 模型偏回歸系數的t檢驗結果
模型的常數項、Z1、Z2的偏回歸系數分別是3.343、0.020、0.024;對 Z1、Z2的偏回歸系數是否等于0的t檢驗結果,t值分別是13.396、7.273,P 值分別為P<0.001、P<0.001。據此,得到應變量lg Y的回歸方程:

對模型進行殘差分析,根據殘差圖觀測,挑選出2個異常值,結合專業判斷予以剔除。如圖1所示,該模型基本符合多元線性回歸的LINE條件。

圖1 殘差圖
通過主成分回歸擬合,得到有統計學意義的模型。為了實際應用的可操作性,需要把主成分表達式代入主成分回歸方程,以便在對應變量預測時,代入自變量X1~X5的原始數據就可以,其模型如下:

將某期的X1~X5的數據代入模型后,得到lg Y的測算值Y,并進行10為底的指數變化后,便可得到當期的出院人次的預測值。同時,可以預測各自變量在一定的區間內的變化對應變量的影響程度。
通過主成分回歸模型的應用,對醫院某些指標的預測將更趨于可靠;有助于科室綜合目標的管理趨向精細化、系統化;同時,有助于職能科室指導臨床科室如何加強指標管理。
由于模型基于樣本數據的擬合,決定了模型的擬合度局限于樣本的特性,因此,當所研究的醫院已經在發展方式、管理流程等影響醫療產出效率的關鍵因素發生變化時,模型應該根據歷史數據適時再次擬合。
1.孫振球,徐勇勇.醫學統計學.北京:人民衛生出版社,2002:328-329.
2.張文彤,董偉.SPSS統計分析高級教程.北京:高等教育出版社,2004:97-98.