陳瑤,于典,張曉斌
1.安徽醫科大學 生物醫學工程學院,安徽 合肥 230032;2.安徽醫科大學第一附屬醫院北區 醫學工程部,安徽 合肥 230012;3.安徽醫科大學第一附屬醫院 醫學工程部,安徽 合肥 230032
自新醫改實施以來,耗材管控一直是醫療改革的重點[1-2]。從“兩票制”初步嘗試降低耗材虛高價格,到“帶量采購”限制耗材價格,再到2022年新版績效考核操作手冊中新增“重點監控高值醫用耗材收入占比”,耗材的精細化管理及醫用耗材收入占比的管控成為醫院成本管理的重要研究方向[3-5]。我院是新建三級綜合醫院,患者量逐年增加,耗材成本也逐年遞增。為嚴格控制醫療成本,改善醫療費用結構,減輕群眾就醫負擔,我院將各科室耗占比考核納入醫院績效管理方案中。
從整體上看,醫用耗材的管控研究可以分為兩類:① 偏向于定性分析,通過措施制度等完成管理;② 偏向于定量分析,使用數學模型進行量化預測。定性分析中不少醫院通過招標采購、制度落實以及信息化管理系統等精細化手段降低了耗占比[6],比如通過PDCA 分析耗占比高的原因并提出了針對性的改進措施[7-8],或者基于SPD 模式進行耗材的精細化管理探索[9-10],以及基于疾病診斷相關分組構建管理方案[11]。上述定性分析雖然在耗占比管控中取得了一定的成效,但容易被主觀因素影響,因此,定量分析方法相對更科學準確。定量分析具體可分為兩種思路:① 把耗材變化量作為時間序列進行預測;② 分析耗占比的影響因素,利用醫院運營數據建立指標體系并預測耗占比。時間序列預測中,常見的模型有以自回歸積分滑動平均模型(Autoregressive Integrated Moving Average,ARIMA)[12]為代表的線性模型以及以長短期記憶神經網絡(Long Short Term Memory Neural Networks,LSTM)[13]為代表的非線性模型,但當時間序列數據受到如新科室新耗材引入等因素影響時,精度會受到影響。耗占比具備非線性、波動性、影響因素較多等特點,而反向傳播(Backward Propagation,BP)神經網絡在非線性和多元統計上表現良好[14-15]。本研究利用我院近2年的運營數據建立神經網絡模型,預測每月各科室耗材的使用占比,進而判斷科室耗材使用是否合理,為醫院績效考核及管理提供參考依據。
本研究以安徽醫科大學第一附屬醫院2021年1月至2023年5月的運營指標為研究對象,具體可分為科室、月份、總收入、藥占比、入院人次、出院人次、手術量、平均住院日、病床使用率、病床周轉次數10 個指標,并與預測值耗占比構成原始數據集925×11。為更好地評估模型預測性能,選取68×11 為測試集、857×11 為訓練驗證集,再將訓練驗證集數據進一步劃分為80%訓練集和20% 驗證集。訓練集數據用于建立回歸模型,驗證集數據用于驗證回歸模型的性能,最后使用測試集完成模型的測試。
BP 神經網絡由多層神經元相互連接組成,具體可分為輸入層、隱藏層和輸出層,見圖1。在網絡中,同層神經元之間無連接,但每個神經元與下一層所有的神經元相互連接,即每個神經元的輸出為下一層神經元的輸入。與單個神經元類似,每兩個連接的神經元之間都具有對應關系,第i個神經元與下一層第j個神經元權重可記為wij,偏置記為bij,樣本個數為n。非線性轉換函數定義為激活函數,是為了在網絡中引入非線性因素以增強模型的表達能力,因此第o層的輸出y(o)的計算方式如公式(1)所示。

圖1 BP神經網絡結構
BP 神經網絡的學習過程分為正向傳播和誤差的反向傳播,流程圖如圖2所示。正向傳播時,輸入數據由輸入層輸入,經過隱藏層逐層處理后,傳導至輸出層,再通過損失函數計算出輸出層的實際輸出與期望輸出的差異后,進入反向傳播階段。反向傳播過程中,首先向網絡反饋輸出誤差,再通過隨機梯度下降法或其他優化算法計算并更新權值和偏置后,轉入正向傳播。正向傳播與反向傳播反復迭代,直至學習次數達到預定值或誤差達到要求為止。

圖2 BP神經網絡流程圖
BP 神經網絡具備強大的非線性建模能力,可通過反向傳播完成對模型的訓練和學習。有很多學者采取BP 神經網絡的方法完成預測回歸任務[16-21],并取得了良好的成效,因此,依據BP 神經網絡建立耗占比預測模型在理論上是可行的。
1.3.1 數據預處理
為保證輸入模型的數據集有效且可靠,需要進一步對原始數據進行處理。原始數據集中包含了因新開科室或重新裝修導致的指標空值、醫院信息系統導出時出現的異常值、科室為類別型數據的離散特征等。對于指標空值,將其刪除;對于異常值,將其替換為零值;對于離散特征的科室指標,考慮到科室較多,若使用Onehot Encoding 會造成特征空間較大,不利于模型的輸入,因此本文選擇采用Target Encoding 編碼方式[22]將不同科室名稱編碼成可輸入模型的浮點型數值,最終生成925×11 的預處理數據,數據的類型如表1所示。

表1 耗占比數據集類型描述
為進一步探究耗占比數據的相關性,本文對數據集中的各指標進行相關性分析。以耗占比為因變量,通過各自變量與耗占比的線性相關程度計算出各指標的Pearson 相關系數,見圖3,科室、手術量和總收入與耗占比呈明顯正相關,而藥占比與耗占比呈明顯負相關??紤]到各指標間的非線性關系,以及各指標對耗占比產生的不同程度影響,將各項指標全部保留。

圖3 耗占比數據集相關性分析熱力圖
1.3.2 神經網絡模型參數設定
為探究BP 神經網絡對耗占比預測的效果,本文搭建了編程語言為Python 3.7、開發框架為Tensorflow 的預測模型進行實驗。
在模型訓練中,將10 個運營指標作為整個模型的輸入,經過隱藏層的計算后,最終通過最后一層輸出層輸出最終的預測耗占比。損失函數選擇均方誤差(Mean Squared Error,MSE)函數,計算方式如公式(2)所示。

模型優化算法選擇自適應矩估計(Adaptive Moment Estimation,Adam)優化器,Adam 吸取了自適應學習率的梯度下降算法和動量梯度下降算法的優點,一方面可以緩解梯度振蕩問題,另一方面也可以適應稀疏梯度。具體計算方式如公式(3)~(5)所示。
式中,gt為梯度,β1=0.9 與β2=0.9999 為平滑常數,分別用于計算累計梯度的一階指數平滑值(mt)與累計梯度的二階指數平滑值(vt)。通過公式(5)對變量進行更新,θt為模型參數,?、η為常量,?=10-8防止出現除0,η=10-4為設置的學習率。設置Epoch 最大迭代次數為300 次,激活函數選擇線性整流函數以增加模型的非線性與稀疏性。
經過測試,最終選定BP 神經網絡模型的隱藏層為3 層。層數較少時,網絡會因參數較少無法對數據中的各特征進行很好的擬合,導致預測值與真實值相差較多;層數較多時,可能導致模型在訓練集上過擬合,在驗證集與測試集上表現較差。
1.3.3 模型對比及評價指標
為進一步衡量BP 神經網絡模型的先進性,引入了貝葉斯嶺回歸模型、普通線性回歸模型、支持向量機回歸模型與梯度提升回歸模型進行模型對比。通過設置同等隨機數種子與相同歸一化參數獲取與BP 神經網絡模型相同的輸入數據,對各模型進行訓練后,使用驗證集及測試集進一步對比模型。
與此同時,引入評價指標對上述各個模型進行更深層次的對比。評價指標為解釋方差(Explained Variance,EV)、平均絕對誤差(Mean Absolute Error,MAE)、MSE 與R2。其中,EV 用于解釋回歸模型的方差得分,計算方式如公式(6)所示,取值范圍為[0,1],越接近1 說明預測值越可以解釋真實值的方差。MAE 用于評估預測值和真實值的接近程度,計算方式如公式(7)所示,取值范圍為[0,+∞),值越小說明回歸效果越好。MSE 用于評價預測值與真實值的變化程度,取值范圍為[0,+∞),值越小說明回歸模型的精確度越好。R2用于反映因變量可通過回歸模型被自變量解釋的比例,計算方式如公式(8)所示,取值范圍為[0,1],越接近1說明模型越精確,回歸效果越好。
式中,Var為方差;y為真實值;為預測值。
經過300 次迭代后,神經網絡迭代損失如圖4a所示。在0~50 迭代次數中,網絡損失存在明顯下降;50~300迭代次數中,網絡損失存在波動,但在260 次數后趨于穩定,最后網絡損失為1.544×10-8。使用驗證集讀取訓練迭代后的模型權重文件,對BP 神經網絡模型進行驗證,結果如圖4b所示,預測值與真實值比較接近。

圖4 BP神經網絡模型結果
各對比模型在驗證集上的預測值與真實值對比如圖5所示,對各模型在驗證集及測試集上進行評價,評價結果如表2~3所示。驗證集上,貝葉斯嶺回歸模型、普通線性回歸模型以及支持向量機回歸模型表現較差,預測值與真實值接近程度一般;梯度提升回歸模型預測值與真實值更為接近,各評價指標均優于貝葉斯嶺回歸模型、普通線性回歸模型和支持向量機回歸模型,EV與R2都達到了0.93 及以上,精度良好。BP 神經網絡模型的EV 與R2均達到0.99 及以上,且MAE 與MSE 數值相較于上述模型低了不止一個數量級。測試集上,各對比模型評價指標表現比驗證集上稍好,梯度提升回歸模型EV 與R2均達到了0.95 及以上,而BP 神經網絡模型評價指標相較驗證集雖有所下降,但EV 與R2均大于0.96,MAE 小于0.03,仍可說明BP 神經網絡模型的優勢。

表2 各模型驗證集評價指標

表3 各模型測試集評價指標

圖5 驗證集各模型回歸結果對比
本文選取我院2021年1月至2023年5月的數據進行預處理,將857×11 的數據用于訓練集和驗證集的BP 神經網絡模型,剩余68×11 的數據用于測試該模型,驗證與測試均取得優秀的結果。通過預測的結果可以直觀了解各科室的耗占比數值,為醫院管理部門實施績效考核提供有力的支持,避免耗占比考核中主觀判斷的經驗成分誤差。
由于醫用耗材的復雜性,建立在定量分析基礎上的模型預測很難與實際情況完全匹配。對時間序列預測而言,楊越等[23]使用專家建模器對某型號吻合器使用量進行預測,預測結果R2=0.317。白玲等[24]通過ARIMA模型完成對醫院注射器使用量的預測,MAE 為5.308。楊燕等[13]通過LSTM 模型實現了醫院靜脈留置針領用量的預測,最初預測半年及一季度的R2分別為0.95 與0.97,但當時間序列數據受突發因素影響時,預測半年及一季度的R2值分別為-0.63 與0.33。由于時間序列預測模型更偏向于時間序列對下一個階段的預測,而醫院績效考核主要評價當下耗占比是否合理,因此本研究基于BP 神經網絡模型對各科室耗占比進行預測,驗證集R2=0.998418,均優于其他對比時間序列預測模型,測試集R2=0.962357,僅比LSTM 模型中時間序列數據不受突發因素影響時的一季度R2小0.1,這凸顯了BP 神經網絡模型在利用醫院運營數據建立指標體系預測耗占比方面的優勢。對于BP 神經網絡模型而言,更多的數據量理論上能帶來更精確的模型,而測試集各評價指標的降低正是因為醫院新科室的建立。新科室的數據量較低于其他科室數據集,在一定程度上導致了模型精度的降低。因此,當前預測模型應及時更新各科室數據,以保證模型的精確度。
本文以醫院各科室運營指標為研究對象,訓練建立BP 神經網絡模型預測各科室耗占比指標,預測精度較高,各評價指標均優于其他模型,為醫院管理部門對各科室耗材的考核評估提供了量化數據的支撐。但在實際應用中,若新建科室數據量不足,會導致模型精確度下降,因此后續需及時更新科室數據信息,引入更為先進的BP 神經網絡模型,完成更精確的評估。