張曙+曹禺+宣琦+倪菁+胡振敏
[摘 要]本文在數據中心的基礎上,對標準化存儲的時間序列數據,采用自回歸求和滑動平均ARIMA模型進行預測,從而對醫院的門診人次、住院床位進行準確預測和分析,為醫院決策提供數據支撐,從而提高醫院運營和資源利用效率,使醫院總體管理效能得到優化。
[關鍵詞]大數據;數據中心;預測模型;時間序列;管理效能
doi:10.3969/j.issn.1673 - 0194.2017.22.040
[中圖分類號]R197.3 [文獻標識碼]A [文章編號]1673-0194(2017)22-00-02
1 研究背景
2016年,國務院辦公廳下發《關于促進和規范健康醫療大數據應用發展的指導意見》指出:“綜合運用健康醫療大數據資源和信息技術手段,健全醫院評價體系,推動深化公立醫院改革,完善現代醫院管理制度,優化醫療衛生資源布局。”可見,醫院通過充分運用健康醫療大數據,結合數據挖掘分析等技術手段,能夠為醫院管理層提供預測方案、決策支持和相應的評價體系,不僅是現代醫院信息化建設的重點,而且也被列入了國家發展重點任務。
在此之前,國外在醫療大數據分析應用、提升醫療管理方面有較深入的研究,如對患者流向和患者行為基于馬爾科夫鏈進行建模,分析病人進入醫療機構的移動狀況,Taylor 等建立了包括4個連續狀態的馬爾科夫模型等。國內在此領域也有一定的研究,例如,解放軍301醫院將提取患者的診療數據進行時間節點建模,還原患者的就診路徑,發現門診效率和患者等待時間、收費窗口訪問頻次、檢查劃價收費等是影響門診效率的關鍵因素。但是,目前國內大多數醫院在醫療大數據利用方面,仍然處于數據的報表化或圖表化數據分析展示階段,只能對當前或歷史數據進行簡單的分析與展示。這種方式雖然對醫院的管理分析有一定的幫助,但對于管理決策層的“先知、先覺、先判”需求還有較大的差距。本文通過研究基于數據中心的預測模型,建立了關于排隊時間、床位資源使用等方面的預測模型,不僅可以持續改善醫院預警的反應性和一致性,降低成本和風險,增加可用度;還可以讓決策層提前掌握醫院的發展趨勢,幫助決策層做出正確響應,適時做出流程優化再造和資源的合理調配,優化醫院管理效能。
2 基于醫院大數據的管理效能優化預測模型的方法研究
2.1 建立數據中心
本文建立的管理效能優化預測模型是在醫院運營數據中心(Operation Data Repository,ODR)的基礎上實現的,因此本項目首先要建立全院級的運營數據中心ODR。其過程是:醫院從人事、財務、HRP、物資和設備等多個數據源,采集并整合醫療服務及臨床業務系統產生的運營過程記錄信息,通過數據的清洗及質控,建立ODR。ODR的建設過程主要包含兩大部分:第一,先建立數據復制庫,然后對復制庫中的數據經過ETL過程后存儲到數據中心,對數據進行采集和整合;第二,數據的多維度分析與展現,其中包含了OLAP。醫院通過這兩部分的建設,一方面可以提高全院數據的完整性和準確性;另一方面可以深入對數據進行利用、挖掘和分析,使預測模型更加準確。
2..2 建立預測模型
在ODR基礎上,筆者對標準化存儲的數據進行分析、利用,建立預測模型。為了簡化分析過程,筆者首先根據數據特點將數據中心的數據分為兩類。第一類是橫截面數據,該數據是大體上同時或者和時間無關的不同對象的觀測值組成的數據;第二類是時間序列數據,這是在不同時間點上收集到的數據,這類數據反映了某一現象或事物等隨時間的變化程度或狀態。因此本文建立的預測模型的是在時間序列數據基礎上進行的。時間序列可以用一個變量過去的觀測實際值來預測同一變量的未來值,也就是說,時間序列的因變量為自變量未來的可能值。
由于時間序列具有非線性、非平穩性、快速變化并且包含噪聲干擾的特點,所以國內外很多專家對時間序列進行了深入研究,并提出了多種針對時間序列的預測方法。從大的分類來說,時間序列主要分為兩類:一類是基于模型的時間序列預測,如自回歸滑動平均(Auto-Regressive and Moving Average,ARMA)模型、自回歸求和滑動平均(Auto-Regressive Integrated Moving Average,ARIMA)模型等;另一類是基于人工智能的時間序列預測,如遞歸神經網絡(Recurrent Neural Network,RNN)預測、回聲狀態網(Echo State Network,ESN)預測等。
本文采用自回歸求和滑動平均ARIMA模型。該模型的基礎是自回歸和ARMA模型。假定時間序列用X1,X2,…,Xt表示,則一個純粹的AR(p)模型意味著變量的一個觀測值由以前的p個觀測值的線性組合加上隨機誤差項at(該誤差為獨立無關的)而得。
Xt=φ1Xt-1+L+φpXt-p+αt(1)
本文采用的ARIMA模型方法比傳統方法更加可靠,因為ARIMA模型的擬合綜合考慮了序列的趨勢變化、周期變化及隨機干擾,并借助模型參數進行了量化表達,擬合效果的驗證在理論上具有說服力,在應用上切實可行。ARIMA模型一般情況下有多個參數,利用差分來消除趨勢或循環成分,在對醫院就診這樣的有季節和趨勢等成分的時間序列進行ARIMA模型的擬合研究和預測時,不像純粹的、滿足可解條件的ARMA模型那么簡單。因此,實際建模會更加復雜,需要經過反復比較。
3 應用預期成效
目前,醫院門診患者數日益增長是造成患者排隊時間長、床位資源緊張的重要原因,本文通過提前預測出未來門診就診的患者數量,可以為醫院制定各種預案提供充足的緩沖時間。筆者所在單位通過對已建成的運營數據中心中的5~10年的門診相關歷史數據進行分析建模,可預測醫院在未來某個時間段內患者各個就診環節的排隊及等候時間,幫助決策者提前采用諸如通過擴展第三方支付方式、擴大預約途徑與范圍、改變樓層職能布局、增加床位數量等方式,優化就診流程,提高患者就診效率,改善就醫體驗,提高患者滿意度,解決“看病難”的問題。預測分析結果如圖1所示,該模型通過對掛號排隊時間、掛號后就醫等待時間、醫生問診時間、門診繳費等待時間、發藥等待時間、化驗等待時間、檢查等待時間和報告等待時間等指標進行預測分析,可得出患者在就診各個環節花費的時間,從而有針對性地對花費時較長的環節進行優化。圖2為科室單日掛號人次預測趨勢圖。
另外,醫院住院床位緊張也是各大醫院的突出問題,本文通過建立課題預測模型可以解決這一難題。本文通過建立預測模型,不僅可以預測住院人數,還可以深入分析現有的病床使用情況,使病床得到充分利用,進一步使醫院資源得到有效分配,為病人帶來方便。
4 結 語
本文通過建立醫院大數據的管理效能優化預測模型,實現了醫院對患者就診整個流程的實時監測和預測分析,包括對門診患者和住院患者的人數預測。該系統最大的創新點有以下兩個方面。首先,在標準規范和安全體系架構下,該模型將全院數據進行標準化存儲建成數據中心,從而建立相關預測模型,確保了數據的完整性和統一性,減少了預測的誤差,使預測更加精準,為醫院領導層提供更加準確的決策支持。其次,該模型能夠充分利用醫院歷史和實時數據,為醫院管理者提供處理關鍵報警所需的信息和指導,提升醫院的總體管理效率,并縮短患者就診時間,有效解決患者“看病難”的現狀,為廣大醫療患者謀福祉,響應了國家政策。
主要參考文獻
[1]寧媛,李皖.圖像去噪的幾種方法分析比較[J].貴州工業大學學報:自然科學版,2006(34).
[2]李彥,汪勝前,鄧承志.多尺度幾何分析的圖像去噪方法綜述[J].計算機工程與應用,2011(47).
[3]范啟勇,秦曉宏,劉青,等.上海市醫院信息集成平臺建設與實踐應用指南[M].北京:科學出版社,2016.
[4]白國剛,楊宏橋.醫院數據中心建設研究[J].中國醫療設備,2012(7).
[5]倫淑嫻,林健,姚顯雙.基于小世界回聲狀態網的時間序列預測[J].自動化學報,2015(9).
[6]饒運章,徐水太,熊靈燕.基于ARIMA模型的礦區重金屬污染時間序列預測[J].金屬礦山,2010(6).
[7]霍曉宇,楊仕教,吳長振.基于BP神經網絡的混沌時間序列預測方法及應用研究[J].南華大學學報:自然科學版,2012(2).
[8]王衛琪,景立偉.自回歸求和滑動平均模型在醫院藥品收入預報中的應用[J].山西醫科大學學報,2008(3).endprint