王螢,徐琛
(1.首都醫科大學附屬北京朝陽醫院財務科,北京 100043;2.首都醫科大學附屬北京朝陽醫院病案統計科,北京 100043)
基于OLAP+DM技術的醫院財務分析系統的設計與實現
王螢1,徐琛2
(1.首都醫科大學附屬北京朝陽醫院財務科,北京100043;2.首都醫科大學附屬北京朝陽醫院病案統計科,北京100043)
文中成功將醫院的數據信息庫與下屬醫院的信息庫有效相結合,建立了龐大的整合數據資源池,并經過一系列的數據抽取、轉換和加載為資源的整合做出了有效的準備工作,且最終建立了一個有效的財務分析數據倉庫,解決了始終困擾行業的數據孤島問題。在此基礎上,還經過一些列的分析和推導,利用OLAP和DM技術,對財務報表進行了全方位多維度的分析,同時對于數據的可靠性和價值性進行一定程度上的數據挖掘,將對數據分析的結果提供給醫院的管理層和決策層。對系統地測試表明,該系統在數據分析和處理整合上均具有可靠性和權威性。
醫院財務系統;數據庫;數據整合;技術分析
進入21世紀以后,計算機信息技術發展突飛猛進,我們的生產生活方式已經發生了巨大的改變,已經避免不了要和大量的數據信息進行交流溝通,對于醫院來說,更是如此,作為社會上的職能機構每天要處理很多龐大數據信息,作為醫院的管理層和決策層,如何在大量的數據流量信息中捕捉到有價值的信息,從而進行有針對性的正確決策是一個考驗著IT工作者們的難題,而這也決定著一個醫院的成敗興衰和工作效率。正是為了解決這種實際問題,文將本來用于數據倉庫管理的OLAP技術和用于數據挖掘的DM技術移植到數據處理中來[1],為財務分析工作進行輔助,在對這兩種技術進行深入的與原理剖析后,結合醫院目前的運行現狀,對系統的功能和設計進行綜合考量,最終確定了一套行之有效的設計原則和標準,使用該系統后可以改變醫院以前的每月月報的傳統財務分析行為,可以在系統中直接進行綜合整理和上報,這有效的提高了醫院的運行效率,除此之外,系統還能只能分析財務報表,將隱含的突出信息上報給決策層。
1.1體系結構的設計研究
文中設計的這款系統的體系結構可分成4個層次,如圖1所示,位于體系最底層的是數據獲取層,數據源主要是醫院的日常財務報表,這里面包括各類憑證數據,要保證數據的統一性和一致性必須對數據進行必要的抽取,清理和轉換,而后在將統一后的數據類型進化型存入操作,目標地址是數據倉庫。這里面采用的是SAP BW數據抽取機制[2],通過一定得技術手段將數據先加載至PSA再通過與信息源的對照等更新規則的清洗加載到ODS中,最終進入目標地址信息立方體。
數據存儲層的主要功能是用來處理講過加工后的數據,來源主要是醫院日常的財務系統地數據流,按照某種需求進行重新的組織和處理,這個層面的主要功能是為醫院的決策層提供大量的規范化的數據以便于進行分析從而做出正確的判斷。
數據處理層是體系結構中很重要的一個環節,主要工作原理是利用OLAP技術和數據挖掘技術對醫院的信息數據流進行立方式的設計和處理,從而刪除不必要的信息,有價值的信息進行保留上傳至下一環節。

圖1 醫院財務分析系統的體系結構設計Fig.1 Architecture design Hospital Financial Analysis System
1.2數據準備模塊相關設計研究
設計這個模塊的主要作用是將醫院的各個部門之間不同的數據類型新型轉換清洗和加載[3],由此可使得數據具有統一性。要達到這個目的,首先應對數據源和數據倉庫進行數據化建模。
在進行數據處理時,要考慮數據源結構等相關問題,即數據源結構是什么樣的,在抽取結果中EPR是包含著那些有價值的數據,諸如此類問題必須在EPR系統中提前定義好,這個過程通常稱之為數據源建模,我們設計的這款財務分析系統使用的就是EPR系統中的財務模塊數據[4]。設計的系統中將存在兩種數據類型庫,分別如圖表1和表2所示,表1表示的是資產負債表的數據源建模相關參照標準,表2是利潤表的數據源建模系統相關參照標準。

表1 資產負債表相關數據源建模Tab.1 Balance sheet data source modeling

表2 利潤表相關數據建模Tab.2 Income statement data modeling
根據系統實際需求,這個數據倉庫會按照多維分析和指標分析等將邏輯模型設計為兩個可擴展的星型模型。
Ⅰ在系統中多維分析模塊是由兩個部分組成,即一個事實表和六維表組成。其中的每一個維表包含的SID表均由三部分組成,即屬性表,文本表和層次表[5]。
Ⅱ指標的分析模塊的邏輯模型是由兩部分組成個,即一個事實表和4個維表,這些屬性會在財務分析系統中起到至關重要的提示作用,為系統的操作帶來了方便,分別是時間維表,單位名稱維表。
1.3多維分析模塊的設計研究
在系統設計中,這個模塊的主要功能是將各選定的科目以一種多維的方式顯示出來,使用者可通過OLAP技術對這些數據進行比較分析,即使用OLAP的在維度方面的變化功能對一個單位不同年份進行縱向比較和分析,或者對同一個時間節點的不同單位進行橫向比較。
這個模塊的優勢或者說是特色功能是可以利用數據挖掘技術中的OLAP技術進行數據的維度操作[6],這運行在財務分析系統上是一個技術創新,這在實際使用中具有很有價值的意義,例如若要比較某一個單位在不同年份上的同一個時期或者季度的營業情況或者比較同一年份的不同單位的效益情況都需要一種維度的比較?;诖?,本系統采用了分組序號聚焦算法,這能提高查詢效率,顯著提高了排序的速度。
該算法步驟中主要有兩大部分組成,即排序和分組聚集兩個部分,在排序中,首先是要將查詢分解為單維表,其次將各維表按照查詢的關鍵字進行分組編號,再次將事實表中的每個需要記錄的字段進行對應維表的替換工作,新的關鍵字就在系統中連接起來了。排好序后,將按照關鍵字進行分組的聚集求和,這個過程與剛才的排序過程相反,它是將記錄的關鍵字從后向前依次分解出各維表的分組序號,相同的分組序號顯然可以納入一組,最后再系統中對其求和操作。這個算法的流程圖可用如圖2所示的框圖表達出來。
1.4報表輸出模塊的研究設計
在上文提到的多維度分析模塊中有兩種報表,分別是運營收入狀況分析和費用情況分析的報表。其中在“運營收入狀況分析”中,其收入主要來源于門診和醫藥費等環節,使用者通過這個財務分析系統中不僅可查詢到醫院各年度的銷售收入狀況,還可進行下鉆操作,而這依賴于OLAP技術的運用[7],這樣可以獲得本年度醫院各項銷售和運行狀況財務分析情況。
在“費用支出情況分析中”,費用情況被系統自動分為了醫院門診費用,管理維護費用和財務費用等3大類,這每一大類都有不同的費用科目進行選擇,其結構設計情況大同小異,分4個維度進行表征,主要為單位,利潤,費用科目情況和時間節點4個維度。使用者在系統中可通過OLAP技術添加利潤版塊額度,這便于決策者對不同的模塊進行統計分析。表3給出了醫院財務分析系統的指標分析情況和具體科目表。

圖2 分組序號的聚集算法流程框圖Fig.2 Packet sequence number of aggregation algorithm flow diagram

表3 財務分析系統中的指標分析模塊樣本Tab.3 Financial analysis system index analysis module sample
2.1數據倉庫的建模實現
數據倉庫概念是在關系型的數據庫模型的基礎上發展而來的,其所表征的數據類型應該具有以下幾個基本特點和特點,即非冗余性、穩定性、一致性和最終數據使用的靈活性等特點。這個程序是系統中必要的準備,為以后數據庫的大量數據提取和存儲提供了技術支持。
這個程序主要的功能即是從zbalance表和 faglflext表中獲得數據[8],而后將數據按照月份想加的方式從而得到醫院的各項財務部門的期末余額,這些數據都將保存在資產的負債表中,最后經過數據分析和提煉上報決策層做出最正確的選擇。

zbalancep.”從資產負債表對應科目中讀出所有記錄,存放在 zbalancep表中
2.2多維分析模塊的報表開發與相應實現
在設計的這款醫院財務分析系統中為了加快計算及相應的速度和利用好存儲效率,里面運用了OLAP聚焦查詢的算法,這即是對CUBE事實表進行預計算,具體實現方式是對要查詢的維度進行聚焦運算,將結果保存在實施表中。
系統中采用分組序號聚焦算法明顯提高了查詢效率,當事實表記錄數越多,這種算法提高效率的效果更加理想。舉個例子,在實驗中記錄的數據為100 000時,利用分組聚焦算法的計算機查詢速度是3 s,當采用傳統的聚焦算法時,查詢速度為99 s,結果如下表4所示。
2.3指標分析模塊的報表相關開發與實現方式
在這個模塊中使用的是模糊識別的算法,這實現了對輸入測試的樣本集的4項重要指標分析,這能根據指標數據的不同對數據進行只能預警分析,這也就引起了醫院決策層的注意。
查詢效率高是這個模塊應該具備的基本特征,數據存儲在數據倉庫中,進行預計算和聚焦運算,當決策層要查詢相關數據時,就可以隨時進行訪問,這極大地提高了數據分析的效率。維護性好和維護量小也是系統的一個特色功能,醫院的財務分析系統在建立的時候就已經設定好取數邏輯和查詢邏輯。這無需專門人員進行操作和處理,只要對模型進行稍加修正即可。圖3是指標分析模塊的切片設計分析圖。

表4 分組聚焦算法與傳統聚焦算法相關運算效率的比較結果Tab.4 Comparison of the results of the focus groups related to the algorithm algorithm with the traditional focus of the operation efficiency

圖3 指標分析模塊的切片設計圖Fig.3 Slice design index analysis module
OLAP技術和DM技術經過多年的發展已日趨成熟,并在眾多行業得到了廣泛的應用,而將這兩種技術結合起來為醫院的財務方面決策層提供服務卻是近些年才興起來的。本文成功將這兩種技術應用于醫院的財務分析系統中,經過一系列的數據抽取和轉換等操作,建立了一個適用于醫院財務部門的信息數據系統,解決了一直存在的數據孤島問題,在建立的這個數據倉庫中利用OLAP技術和DM技術進行數據挖掘,對醫院財務狀況進行深入分析研究,且對數據進行了價值判斷,這些結果將直達決策層,為醫院管理者的分析和決策提供了重要的技術支持。
[1]Efrem G.Mallach.Decision Support and Data Warehouse Systems[M].李昭智,李昭勇,譯.北京:電子工業出版社,2001.
[2]Paul Gray Hugh J.Watson.Decision Support In The Data Warehouse[M].北京:北京理工大學出版社,2001.
[3]Daubechies I.Ten lectures on wavelets[C].Philadelphia,Pennsylvania,SIAM Mathematieal Analysis,1992.
[4]British Standard Institution.BS EN 50160:2007 Voltage characteristics of electricity supplied by public distribution system[S].2007.
[5]IEEE Standards Coordinating Committee 22 on Power Quality,IEEE Std 1159-1995.IEEE Recommended Practice for Monitoring Electric Power Quality,ISBN-1-55937-549-3,1995.
[6]何玉潔,張俊超.數據倉庫與 OLAP實踐教程[M].北京:清華大學出版社,2008.
[7]徐潔磐.數據倉庫與決策支持系統[J].北京:科學出版社,2005.
[8]遲忠先,李艷紅,張春濤.OLAP核心技術—數據立方體的研究現狀與展望[J].計算機工程,2002,28(10):1-2.
Design and implementation of financial analysis system with hospital based on techniques of OLAP+DM
WANG Ying1,XU Chen2
(1.Financial Affairs Office,Beijing Chaoyang Hospital affiliated to Capital Medical University,Beijing 100043,China;2. Statistical room of Medical Records,Beijing Chaoyang Hospital affiliated to Capital Medical University,Beijing100043,China)
In this paper,the success of the hospital′s data bank and affiliated hospitals effectively combine information base,establishment of a large integrated data resource pool,and after a series of data extraction,transformation and loading for the integration of resources to make effective preparations,and the eventual establishment of an effective financial analysis of the data warehouse,to solve the industry has been plagued by the problem of data islands.On this basis,but also through analysis and derive some out using OLAP and DM technology,the financial statements of a full range of multi-dimensional analysis,and for the reliability and value of data mining to some extent,will the results of the data analysis provided to the hospital′s management and decision-making.To systematically test shows that the system is reliable and authoritative in the data analysis and processing integration.
hospital financial system;database;data integration;technical analysis
TM933.4
A
1674-6236(2016)05-0051-04
2015-04-17稿件編號:201504177
王 螢(1982—),女,北京人。研究方向:數據庫、醫院財務分析。