馬 超,張云華
(浙江理工大學 信息學院,杭州 310018)
國內醫(yī)療行業(yè)迅猛發(fā)展,越來越多的先進醫(yī)療設備被研發(fā)出來,投入到醫(yī)院的臨床應用中,為患者的治療做出了積極的貢獻。但與此同時,醫(yī)療設備故障也屢見不鮮。現代醫(yī)療設備大都利用計算機技術、放射技術、自動化技術和影像處理技術等,系統(tǒng)龐大,設計復雜,通常都需要配有單獨的設備機房,并配有相關維護管理人員。設備管理人員如果能提前發(fā)現設備存在的隱患并及時處理,能夠避免一系列事故。
近年來,國內外學者針對醫(yī)療設備的故障預警做了很多研究。熊剛等人利用單片機整合了設備監(jiān)控的各個傳感器的檢測數據,通過各傳感點的數值是否處于正常閾值內來決定是否上報警告。徐立坤等人利用基于改進的BP神經網絡進行設備的故障預警研究,基于歷史故障數據和粗糙集理論對神經結構和算法進行優(yōu)化。陳艷等人利用粗糙神經網絡和數據挖掘技術研究醫(yī)療設備故障預警。
故障的預警并不是在故障發(fā)生時才發(fā)出警報,而是借助于先前一系列的變化數據來推斷后續(xù)的數據曲線,從而提早發(fā)現問題數據,做出相應的警報。循環(huán)神經網絡(Recurrent Neural Network,RNN)是一種用于處理序列數據的神經網絡,但在長序列訓練中會出現梯度消失和梯度爆炸問題。長短期記憶神經網絡(Long short-term memory,LSTM)在RNN模型的基礎上進行的改進,增加了門控機制的設計,使得其在較長的序列中有更好的表現,有更久的記憶特征,在數據預測方面優(yōu)勢明顯。
本研究采用LSTM-RNN的神經網絡模型對醫(yī)療設備的故障預警進行研究,在分析了醫(yī)用紅外熱像儀的相關故障數據后,列出了8項故障特征點,采集其數據并進行預處理,作為實驗的數據集,同時與BP神經網絡、RNN神經網絡預測模型進行實驗對比,驗證本模型的高效性。
循環(huán)神經網絡(RNN)是一種具有循環(huán)結構的神經網絡,能夠很好地處理序列變化的數據,其網絡結構如圖1所示。模塊在時刻同時讀取了輸入X和上一個時刻的輸出數據h,輸出h并進入下一個循環(huán),通過對數據的循環(huán)處理來提取序列中隨時間變化的特征。

圖1 RNN網絡結構Fig.1 RNN network structure
長短期記憶神經網絡(Long short-term memory,LSTM)是一種特殊的RNN。RNN在長序列訓練中,梯度隨著距離增加逐漸減弱,整個模型的梯度被近距離的梯度主導,難以學到遠距離的依賴關系。LSTM通過門控設計,有選擇地傳遞記憶信息,避免了長序列訓練中發(fā)生上述問題,在數據預測領域有廣泛的應用。
傳統(tǒng)的LSTM在時刻的細胞單元結構如圖2所示。設計了3個門來保護或丟棄細胞的信息,分別是輸入門(i)、遺忘門(f)和輸出門(o)。圖2中,x表示一個輸入節(jié)點,用來對應一個特征參數,在本文中代表影響紅外熱像儀運作的重要特征點,h表示時刻單元的信息輸出向量,C表示時刻記憶細胞的計算狀態(tài)。

圖2 LSTM單元結構Fig.2 The unit structure of LSTM
LSTM通過3個階段來傳遞信息。對此擬做闡釋分述如下。
(1)第一階段。利用遺忘門丟棄細胞狀態(tài)中不需要的信息,對此可表示為:

其中,為函數;W為遺忘門系數權重矩陣;h為前一時刻的輸出;x為此刻的輸入;b為遺忘門偏置矩陣。
(2)第二階段。選擇記憶階段,通過輸入門來選擇將要更新的值,對此可表示為:

其中,i為輸入門信息,為函數;W為輸入門系數權重矩陣;h為前一時刻輸出;x為此刻的輸入;b為輸入門偏置矩陣。
創(chuàng)建一個新候選值向量~C,加入到狀態(tài)中,推得的數學公式可寫為:

其中,為數學函數;W為權重矩陣;h為前一時刻輸出;x為此刻的輸入;b為偏置矩陣。
更新細胞狀態(tài)C,將舊狀態(tài)與遺忘門相乘,確定需要丟棄的信息,并加上輸入門的新候選值,得到最新的狀態(tài),推得的數學公式見如下:


(3)第三階段。是輸出階段。首先對輸入進行函數運算,然后對細胞狀態(tài)進行函數運算,并將兩者輸出相乘,得到最終輸出信息h,數學公式分別如下:

其中,o為輸出門信息;為函數;W為輸出門權重矩陣;h為前一時刻輸出;x為此刻輸入;b為輸出門偏置矩陣。
LSTM通過3個階段門狀態(tài)的控制來傳輸狀態(tài),選擇記憶有用信息,遺忘無用信息,減少特征丟失,有效避免了長期依賴以及梯度消失的問題,更有利于依據長期的數據進行預測分析。
本文研究的醫(yī)療設備是醫(yī)用紅外熱像儀,需要確定會導致此類設備出現故障的主要影響因子作為預測模型的輸入。結合此類設備的運行特征以及歷史故障的原因,確定的輸入參數見表1。

表1 模型輸入參數表Tab.1 Model input parameters table
由于各項數據范圍差別很大,隨著訓練的迭代,模型難以收斂,梯度下降得比較慢,精度也不高,所以需要對輸入數據進行預處理。本文使用數據歸一化處理,使得每個特征數據的分布都在0~1之間,基本趨于一致,有利于梯度下降,加快模型的收斂速度,方法計算公式為:

其中,為實際值;表示該項數據中的峰值;表示該項數據中的最低值。
本文的預測模型采用LSTM加全連接層的結構設計,由一層LSTM輸入層、層LSTM隱藏層和2層全連接網絡以及一個輸出層組成,模型結構如圖3所示。利用LSTM控制各項特征的長時記憶,并結合全連接層將LSTM訓練得到的輸出向量進行維度轉換、特征深度融合。采用Adam優(yōu)化器進行優(yōu)化,利用梯度的一階矩估計和二階矩估計來改變各個參數的學習率,各個參數在學習率的動態(tài)調整下逐漸調到最優(yōu)。

圖3 LSTM模型Fig.3 LSTM model
本實驗的數據集選用某醫(yī)院醫(yī)用紅外熱像儀相關數據,采用傳感器采集以及調用儀器SDK開發(fā)包程序進行采集的方式收集了該設備8項特征點最近一年的數據作為本實驗的訓練集和驗證集。
為了準確地計算出模型預測數據與實際數據之間的偏差,本實驗選用均方根誤差()和平均絕對百分比誤差()來衡量實驗的預測效果,數學定義公式具體如下:

其中,(x)是模型的預測值,y是實際值。
經過多次調整模型參數并根據和的結果,選擇了最優(yōu)的模型參數配置,見表2。

表2 參數設置表Tab.2 Parameters setting
利用訓練集數據訓練后統(tǒng)計的訓練集損失結果如圖4所示。從圖4結果可知,該模型對數據的擬合效果較好,模型的均方根誤差在前幾次迭代中快速降低,然后逐漸緩慢降低。

圖4 模型的訓練集損失Fig.4 Training loss of the model
為了驗證本實驗模型的有效性,基于同一數據集對BP神經網絡、RNN神經網絡等預測模型進行對比實驗,利用和指標進行評估,具體評價結果見表3。

表3 預測模型的評價結果Tab.3 Evaluation results of prediction model
實驗結果表明,通過提取醫(yī)用紅外熱像儀的8項特征數據,并利用LSTM的模型進行訓練的擬合效果最佳,值為0.023 5,值為1.69%。相比于BP、RNN等其他的神經網絡預測模型,LSTM預測模型的預測誤差更小,性能更好。
本文針對現有醫(yī)療設備故障預警研究存在的漏報、誤報、不及時報警等問題,提出了基于LSTM的預警模型。利用LSTM在長時記憶特征的優(yōu)勢對可能影響醫(yī)療設備正常運行的特征數據進行深度學習,給出特征的未來序列預測,分析設備可能發(fā)生的故障,達到故障預警的目的。通過對采集到的設備特征數據進行實驗,驗證了本模型的高效預測性能,對數據的擬合效果較好,預測準確度明顯高于BP、RNN等預測模型。該模型可為實現醫(yī)療設備的故障預警提供了參考。