何昱林
四川省德陽市人民醫院運營管理部,四川德陽 618000
隨著醫療衛生體制改革的不斷深化,外部環境變化給公立醫院的發展帶來了巨大的壓力和嚴峻的挑戰。在這種形勢下,醫院需要不斷創新,在滿足社會醫療服務需求的前提下,必須加強對醫院人財物信息資源的管理,通過強化精細化管理來提高醫院的整體運營管理效率[1]。醫院運營效率的提升依賴于臨床科室運營效率的提升[2],如何能夠準確反映醫院臨床科室的運營水平,這就需要對數據進行提取、挖掘,對臨床科室運營效率進行客觀、真實評價。本文將運用K-means聚類算法以德陽市人民醫院的31 個臨床科室為例,對其運營效率進行科學分析,分析結果有助于醫院掌握臨床科室的運行發展,能更好地配置現有醫療資源,也有助于為醫院及科室管理提供發展思路,同時也有助于為臨床科室績效評價提供參考依據。另外,隨著醫院管理由粗放式向精細化轉變,在借助信息技術的基礎上醫院已經積攢了大量的數據,因此,更需要掌握并運用一定的數據挖掘方法,來尋找數據內部的潛在聯系,旨在為分析問題解決問題提供一個新的思路。
聚類算法是無監督學習中應用較廣的學習算法[3]。聚類,顧名思義是按照一定的規則將數據分為若干個類,同一類簇內數據的相似度很高,類與類間的數據差異性很大[4]。通過聚類劃分,每一類可能對應一些潛在的概念,可為進一步的數據分析提供基礎。K-means 是解決聚類問題的經典算法,這種方法簡單快捷也稱為快速聚類法[5]。K-means 是一個反復迭代的過程,并采用距離作為相似性指標。首先要選擇k 個對象作為初始類簇中心,然后根據最小距離原則將數據分配到最鄰近類簇,每個類簇中所有對象所對應的均值再作為新的類簇中心,重復上述步驟,通過對凝聚點進行不斷修正或迭代,直至聚類比較合理或迭代穩定為止[6]。
K-means 算法具有較高的高效性,但也有一定的局限性:①對噪聲和離群點比較敏感;②變量共線會對聚類效果產生影響;③對初始聚類中心敏感,選擇不同的聚類中心會產生不同的聚類結果和不同的準確率[7];④一般用于凸的樣本集聚類,對于樣本數據是非凸的情況聚類效果都不是很好[8]。
聚類結果的評價指標有平均輪廓系數、誤差平方和(sum of squared errors,SSE)等。平均輪廓系數的取值范圍為[-1,1],且平均輪廓系數越大,聚類效果越好。SSE 也稱為手肘法,隨著聚類數k 的增大,SSE 會逐漸下降,當k 達到真實聚類數時,SSE 的下降幅度會驟減,并隨著k 值的繼續增大而趨于平緩,這個肘部對應的k 值就是數據的真實聚類數[9]。但我們在實際分析中聚類不一定存在最優劃分,確定類別個數往往要結合多種方法,多方面進行綜合考慮確定。
運營效率指標的確定是一項非常重要而又復雜、困難的工作,由于各臨床科室間的技術差異性,指標的選擇既要考慮代表性、又要考慮可得性,更要考慮可比性[10]。2019年國務院辦公廳印發《關于加強三級公立醫院績效考核工作的意見》[11],《關于加強三級公立醫院績效考核工作的意見》中公布了三級公立醫院績效考核指標體系,其中運營效率考核指標包含資源效率、收支結構、費用控制、經濟管理4 個部分,共19個指標(表1)。

表1 三級公立醫院績效考核運營效率指標體系
本文以19 個指標作為參考,根據醫院實際情況,建立能客觀、真實反映科室運營效果的運營效率指標(表2)。指標的選擇不需要太繁瑣,要易提取、可操作性好、概括性好,通過指標的設立,能透過現象看本質,更好地幫助科室查找自身在運營管理中的問題。本文中的運營效率指標包含業務指標3 個、經濟指標4 個,業務指標體現科室工作量及效率,經濟指標旨在促使科室調整費用結構,逐步降低患者經濟負擔,提高科室醫療服務價值。

表2 醫院運營效率指標
醫院31 個臨床科室2021年1月至6月的醫院信息系統(Hospital Information System,HIS)數據、病案統計報表,財務報表,數據字段包括每百門診入院患者、每床位出院患者、平均住院日、門診均次醫療服務收入、出院患者均次費用、每床位日均醫療服務收入、成本率,共7 個指標數據,數據真實可靠。
采用Excel 2007 進行數據整理,運用datahoop 平臺建立算法模型進行統計分析。
3.2.1 數據預處理
3.2.1.1 數據形態探索 繪制變量的直方圖,發現某些變量有明顯的右偏,需要通過Box-cox 變換調整數據形態,否則可能會影響模型效果。
3.2.1.2 相關性分析 通過相關系數矩陣分析變量之間的相關性,結果見表3。若相關系數>0.7,說明相關性較強,數據存在信息冗余,信息重疊會增加該變量在數據分析中的權重,需要進行變量刪除、替換或是采用因子分析進行降維處理。

表3 醫院運營效率指標相關系數矩陣
3.2.1.3 標準化 為了消除變量量綱影響,進行零均值標準化處理,結果見表4。

表4 醫院31 個臨床科室運營效率指標零均值標準化結果
3.2.2 K-means聚類
建立K-means 算法模型對31 個臨床科室的運營效率指標進行聚類分析。根據平均輪廓系數(圖1)、SSE(圖2)評價指標,再結合醫院實際情況,聚成4 類效果較好,且每一類別樣本個數相對均衡。

圖1 不同類簇個數下平均輪廓系數變化情況

圖2 不同類簇個數下SSE 變化情況
根據運營效率指標,將醫院31 個臨床科室分為4 類,結果見表5。

表5 醫院31 個臨床科室運營效率指標的K-means聚類分析結果
將聚類結果可視化,根據雷達圖(圖3,封四)分析每一類別的數據指標意義。

第0 類:運營效率次高。有肝膽外科、骨科、基本外科、泌尿外科、神經外科、胃腸外科、心胸外科、心血管內科8 個科室。該類科室每百門診入院患者、門診均次醫療服務收入、出院患者均次費用、每床位日均醫療服務收入、成本率指標數據相對較高。此類科室屬于病種復雜程度較高,能體現醫務人員醫療技術價值,但需要加強成本管控的科室。
第1 類:運營效率低。有兒科、風濕免疫科、內分泌科、皮膚科、中醫科5 個科室。該類科室每百門診入院患者、門診均次醫療服務收入、出院患者均次費用、每床位日均醫療服務收入指標數據低,在醫院的整體運營效率低。
第2 類:運營效率高。有產科、耳鼻咽喉科、婦科、肛腸科、口腔頜面外科、乳腺外科、消化內科、眼科8個科室。該類科室每床位出院患者、門診均次醫療服務收入、每床日均醫療服務收入指標數據相對較高,平均住院日、出院患者均次費用指標數據較低。此類科室病種復雜程度不高,周轉較快,運營效率較好。
第3 類:運營效率次低。有感染科、呼吸內科、康復科、全科醫學科、燒傷整形科、神經內科、腎內科、心身醫學科、血液科、腫瘤科10 個科室。該類科室收治的患者住院時間較長,周轉緩慢,每床位出院患者、每床位日均醫療服務收入指標數據相對較低,整體運營效率偏低,需要加強病種的選擇、管理。
運營效率指標的選擇是分析評價的重點也是難點,指標的選擇既要具有代表性也要避免信息的重疊,要根據醫院管理的實際需求,不同的分析目的所選擇指標的側重點也是不同的。由于不同科室間的差異性,全院臨床科室不能用一把“尺子”丈量,本文重點分析31 個臨床科室,如重癥監護室(intensive care unit,ICU)、神經科重癥監護室(neurological intensive care unit,NCU)、冠心病重癥監護室(coronary intensive care unit,CCU)、急診科等科室的效率指標需要慎重選擇且能與其他臨床科室建立對等的量化評估,這也可以作為下一步的研究方向。
聚類分析是將隨機現象歸類的探索性隨機方法[12],初始中心點、最大迭代次數選擇的不同,結果指標都會有差別。類別數的確定雖然有相應的評價指標,但需要多方考量,并不是平均輪廓系數最大的分類結果最好,要判斷聚類結果與醫院臨床科室實際狀況是否接近、吻合。
由于醫院各科室的發展情況不同,基于臨床科室運營效率數據,運用K-means聚類方法將臨床科室進行分類。醫院通盤考慮所擁有的醫療資源,根據臨床科室的運營效率檔次,將床位、人員、設備等資源的投入進行適當調整、科學規劃,通過合理的資源匹配來提高醫院的總體效率。同時,在醫院給予各臨床科室幫扶的情況下,各科室也要知道自己科室的短板[13],根據指標數據,積極調整管理思路,有針對性地采取相應管理措施,使科室資源達到最大化的利用。
醫療績效評價是政府、大眾和醫院自身關注的焦點,而科室績效評價有利于促進醫院的健康可持續發展[14]。評價科室績效合理性,通常科室自身進行縱向比較,或是科室間在某一維度指標進行橫向比較來作為績效評價依據,缺乏全面、深度的縱橫分析,結果往往缺乏說服力。運用K-means聚類方法,將全院臨床科室放在多個維度指標上進行綜合對比,整個分析過程客觀、科學,對臨床科室績效評價具有一定指導意義。同時,也幫助科室尋找運營過程中的閃光點和薄弱環節[15],為加強臨床科室精細化管理提供參考依據。