王建琴
(河北北方學(xué)院附屬第二醫(yī)院,河北張家口 075100)
在醫(yī)院內(nèi)部績效管理中,核心的問題是績效評估與預(yù)測,這要求必須選擇合理的指標數(shù)據(jù)對醫(yī)院的績效進行衡量。合理指標不僅可反映出醫(yī)院發(fā)展的真實情況,還能預(yù)測醫(yī)院未來的發(fā)展趨勢。傳統(tǒng)公立醫(yī)院的績效考核主要將財政收支情況及醫(yī)院診治人數(shù)作為核心評價指標,該指標簡單且沒有明確的數(shù)據(jù)體系[1-2]。文中使用DRG(Diagnosis Related Groups)模型指標,同時利用改進長短時記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)模型對指標進行訓(xùn)練,從而實現(xiàn)對醫(yī)院績效的有效評估及預(yù)測。
DRG 也被稱為疾病診斷相關(guān)組[3-4],該模型使用各種病例的診斷結(jié)果作為數(shù)據(jù)基礎(chǔ)。同時考慮醫(yī)療設(shè)備、手術(shù)操作、患者信息等與醫(yī)院資源配置相關(guān)因素的影響,進而實現(xiàn)對醫(yī)院綜合績效的有效評估。
DRG 總體可分為三個部分:1)服務(wù)能力參數(shù),包括DRG 分組、權(quán)重因子等,其中DRG 分組表征診室所覆蓋疾病種類的廣度,而權(quán)重因子則表征醫(yī)療服務(wù)的總收益;2)服務(wù)效率參數(shù),包括時間、費用等因素,其中時間因素表示醫(yī)院治愈患者所花費的時間,費用因素則表示治療疾病所需的費用;3)安全參數(shù),即病患治愈率、死亡率等。表1 為DRG 評價指標同傳統(tǒng)指標的對應(yīng)關(guān)系。

表1 DRG指標同傳統(tǒng)指標的對應(yīng)關(guān)系
從表1 中可以看到,相比傳統(tǒng)績效評估指標,DRG 指標考慮到了資源消耗、病癥難度等綜合因素對醫(yī)院績效管理的影響,因此最終結(jié)果更為精準。
LSTM 全稱為長短時記憶網(wǎng)絡(luò)[5-8],該算法能夠克服傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)無法處理包含時間屬性序列的缺點。LSTM 中最典型的結(jié)構(gòu)就是時間記憶模塊,該模塊能從時間序列數(shù)據(jù)中提取出隱藏信息。因此,使用LSTM 可對醫(yī)院時間績效管理數(shù)據(jù)進行分析。
LSTM 網(wǎng)絡(luò)結(jié)構(gòu)通常由多個基礎(chǔ)網(wǎng)絡(luò)單元組成。由三個網(wǎng)絡(luò)單元構(gòu)成的LSTM 網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

圖1 LSTM網(wǎng)絡(luò)結(jié)構(gòu)
LSTM 網(wǎng)絡(luò)單元使用門結(jié)構(gòu)對數(shù)據(jù)進行處理,該網(wǎng)絡(luò)單元由輸入門、遺忘門及輸出門三種類型的門組成。輸入門為結(jié)構(gòu)的數(shù)據(jù)輸入接口,其可從外界獲取新的數(shù)據(jù),同時對數(shù)據(jù)進行預(yù)處理。遺忘門則接收上個單元傳遞而來的記憶信息,再根據(jù)數(shù)據(jù)的權(quán)重,選擇特征最強的數(shù)據(jù)信息,并遺忘特征較弱的數(shù)據(jù)信息。輸出門則負責(zé)將處理完畢的數(shù)據(jù)進行輸出。神經(jīng)單元的當前狀態(tài)可以在基礎(chǔ)網(wǎng)絡(luò)中傳輸,具體的LSTM 單元結(jié)構(gòu)如圖2 所示。

圖2 LSTM單元結(jié)構(gòu)
神經(jīng)單元在上一時刻的輸入數(shù)據(jù)由輸入門輸入的數(shù)據(jù)xt、上個單元記憶狀態(tài)Ct-1以及前單元輸出層狀態(tài)ht-1組成。數(shù)據(jù)輸入后,由遺忘門函數(shù)ft和輸入門函數(shù)it對記憶單元的狀態(tài)進行計算。ft和it的具體計算方法分別如式(1)、(2)所示:
其中,σ和Wf、Wu為網(wǎng)絡(luò)架構(gòu)的權(quán)重系數(shù),bf、bu為偏置。之后對記憶細胞的信息進行計算,如式(3)所示:
最后,根據(jù)記憶單元的狀態(tài)與輸出數(shù)據(jù)對輸出層進行計算。輸出狀態(tài)為Ct和ht,二者可表示為:
為了提高LSTM 的計算準確性,對其進行改進。文中使用雙向LSTM 算法,通過正向與反向數(shù)據(jù)傳輸路徑共同完成數(shù)據(jù)的訓(xùn)練。雙向長短時記憶網(wǎng)絡(luò)(Bi-directional Long Short-Term Memory,Bi-LSTM)結(jié)構(gòu)由正向及逆向LSTM 組成[9-10],逆向LSTM 不斷對正向的參數(shù)進行修正,進而減小正向單元層與層之間的數(shù)據(jù)誤差。最終輸出結(jié)果使用不同的權(quán)重融合得到,具體結(jié)構(gòu)如圖3 所示。

圖3 Bi-LSTM結(jié)構(gòu)
為了滿足模型訓(xùn)練的需求,將Bi-LSTM 結(jié)構(gòu)封裝成殘差結(jié)構(gòu)網(wǎng)絡(luò)。原始Bi-LSTM 模型為淺層模型,使用殘差結(jié)構(gòu)即可滿足深度系統(tǒng)的訓(xùn)練要求。殘差網(wǎng)絡(luò)結(jié)構(gòu)見圖4 所示,且網(wǎng)絡(luò)的映射函數(shù)為H(x)=F(x)+x。

圖4 殘差網(wǎng)絡(luò)結(jié)構(gòu)
各種指標權(quán)重值的訓(xùn)練對于文中的DRG 模型至關(guān)重要。為了得到理想的指標權(quán)重值,此次使用注意力機制(Attention Mechanism)[11-14]對輸入數(shù)據(jù)進行權(quán)重因子訓(xùn)練,進而獲得更為準確的預(yù)測結(jié)果。數(shù)據(jù)分類中的注意力機制本質(zhì)即為一組能對數(shù)據(jù)權(quán)重進行標定的權(quán)值數(shù)據(jù),具體如圖5 所示。

圖5 注意力機制
將注意力機制加入Bi-LSTM 模型,最終得到的多層模型如圖6 所示。該模型由輸入層、嵌入層、雙向LSTM 層、注意力機制層以及輸出層組成。其中輸入層數(shù)據(jù)為DRG 模型中的各項指標,嵌入層首先將數(shù)據(jù)進行預(yù)處理,然后雙向LSTM 層對數(shù)據(jù)加以訓(xùn)練,再由注意力機制層對權(quán)重因子進行輸出,最終得到后續(xù)績效的預(yù)測情況。

圖6 多層網(wǎng)絡(luò)結(jié)構(gòu)
嵌入層的權(quán)重et的計算方式為:
整體系統(tǒng)架構(gòu)如圖7 所示。文中使用三個并行的ATT-Bi-LSTM模型對DRG的三大指標——服務(wù)能力參數(shù)、服務(wù)效率參數(shù)及安全參數(shù)進行訓(xùn)練,并作為績效預(yù)測模型的輸入層。將經(jīng)過該模型訓(xùn)練后的參數(shù)輸入Softmax 分類器,再將三大指標模塊的權(quán)重因子加以融合,最終便可得到績效的評估值與預(yù)測值。

圖7 整體系統(tǒng)架構(gòu)
為了優(yōu)化模型性能進行評估,此次使用四項誤差指標來分析,分別為平均百分比誤差(MAPE)、均方根誤差(RMSE)、平均絕對誤差(MAE)以及決定系數(shù)(R2)。其中,平均百分比誤差與決定系數(shù)可對績效預(yù)測結(jié)果的準確程度進行判斷。而均方根誤差和平均絕對誤差,則能對預(yù)測精度作出評判。這四項誤差的計算公式如下所示:
實驗選擇的數(shù)據(jù)類型為DRG 模型中的各種指標,數(shù)據(jù)采集來源為河北省某大型醫(yī)院的各業(yè)務(wù)部門、醫(yī)療設(shè)備物聯(lián)網(wǎng)終端等,采樣時間為近五年內(nèi)每月的數(shù)據(jù),總量約為10 000 條,且訓(xùn)練集與驗證集的比例為8∶2。具體實驗環(huán)境如表2 所示。

表2 實驗環(huán)境
在性能測試中,選用BP(Back Prpagatin)神經(jīng)網(wǎng)絡(luò)[15]與循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)模型[16]作為對比算法。測試時,三種網(wǎng)絡(luò)的輸入數(shù)據(jù)完全相同,模型運行次數(shù)為10 次,且取預(yù)測權(quán)重的平均值。采用2018-2020 年的數(shù)據(jù)進行訓(xùn)練,并使用2021-2022 年的數(shù)據(jù)加以驗證,得到最終的實驗結(jié)果如圖8 所示。

圖8 性能測試對比曲線
從圖中可看出,與后兩年的實際值相比,該文算法的擬合值相較其他算法而言最為理想,說明其預(yù)測精度較高,且在全局及局部效果中均有較優(yōu)的表現(xiàn)。
為了定量觀察算法的性能差別,使用平均百分比誤差、均方根誤差、平均絕對誤差和決定系數(shù)這四項誤差指標對預(yù)測精度進行對比。對比算法則選用BP 神經(jīng)網(wǎng)絡(luò)、LSTM 網(wǎng)絡(luò)、邏輯回歸模型(Logistic Regression,LR)、Bi-LSTM 模型及RNN 模型。對比結(jié)果如表3 所示。

表3 最優(yōu)值計算結(jié)果
由表3 可知,隨著預(yù)測年數(shù)的增多,由于時間序列數(shù)據(jù)集合的增加,各算法的準確率均有一定的提高。所設(shè)計的ATT-Bi-LSTM 算法預(yù)測兩年的R2 值相較預(yù)測一年的高0.001。同時,與LSTM 和Bi-LSTM模型相比,由于該模型加入了注意力機制,因此能更好地對權(quán)重因子進行預(yù)測,進而得到更為準確的效果。而傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)及LR 模型,二者對時間序列的訓(xùn)練能力較差,導(dǎo)致其性能也不理想,因此測試指標遠落后于該文算法。
由此可見,該文算法能夠根據(jù)已有數(shù)據(jù)集的訓(xùn)練結(jié)果對未來績效結(jié)果進行預(yù)測,故其具有較強的實用價值。
現(xiàn)有醫(yī)院績效考核的數(shù)據(jù)較為片面、整體性差。針對該問題,文中基于指標綜合考慮較為全面的DRG 模型,對LSTM 加以改進,構(gòu)建了ATT-Bi-LSTM 模型對指標數(shù)據(jù)進行訓(xùn)練,再通過分類器融合權(quán)重因子,從而得到較為客觀全面的未來績效預(yù)測結(jié)果。實驗結(jié)果表明,該算法的預(yù)測結(jié)果與實際結(jié)果更為接近,同時誤差指標較低,證明了該算法可對醫(yī)院的績效進行有效評估及合理預(yù)測。