【摘要】 本文主要分析數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘?qū)︶t(yī)院HIS系統(tǒng)未來(lái)發(fā)展的重要性和影響,分析引入數(shù)據(jù)倉(cāng)庫(kù)與挖掘概念以后在醫(yī)院數(shù)據(jù)查詢,藥品采購(gòu),醫(yī)療績(jī)效評(píng)估等方面的簡(jiǎn)單應(yīng)用。
【關(guān)鍵詞】 數(shù)據(jù)倉(cāng)庫(kù) 數(shù)據(jù)挖掘 關(guān)聯(lián)規(guī)則
【中圖分類號(hào)】 R-3【文獻(xiàn)標(biāo)識(shí)碼】 B【文章編號(hào)】 1007-8231(2011) 08-0655-03
在計(jì)算機(jī)技術(shù)飛速發(fā)展的今天,傳統(tǒng)的數(shù)據(jù)庫(kù)技術(shù)已經(jīng)不能滿足大數(shù)據(jù)量的分析要求。醫(yī)院信息系統(tǒng)在多年的建設(shè)和發(fā)展中,積累了大量的原始數(shù)據(jù)。如何使這些陳舊的信息進(jìn)行再開(kāi)發(fā)和利用,從中提取出有用的信息,為臨床和管理服務(wù),是我們建立數(shù)據(jù)倉(cāng)庫(kù),進(jìn)行數(shù)據(jù)挖掘的目標(biāo)和意義。
我們通常的數(shù)據(jù)處理分為兩類,一類是對(duì)這些數(shù)據(jù)只是進(jìn)行傳統(tǒng)的操作型處理,第二類是分析型處理。操作型處理也叫事務(wù)處理,通常是對(duì)一個(gè)或一組記錄的查詢和修改。要求的是響應(yīng)時(shí)間,數(shù)據(jù)的安全性和完整性。分析型處理也叫信息型處理,用于決策分析。想進(jìn)行深入的DSS、多維分析等就要訪問(wèn)大量的歷史數(shù)據(jù),而這樣的分析應(yīng)用就會(huì)影響傳統(tǒng)數(shù)據(jù)處理的響應(yīng)時(shí)間。所以我們有必要引入數(shù)據(jù)倉(cāng)庫(kù)概念。數(shù)據(jù)倉(cāng)庫(kù)技術(shù)為歷史數(shù)據(jù)的分析和處理提供良好的基礎(chǔ),數(shù)據(jù)挖掘使這些海量數(shù)據(jù)真正成為有用的信息。
目前醫(yī)院已經(jīng)有了各種信息子系統(tǒng),有收費(fèi)子系統(tǒng),出入院管理子系統(tǒng),門診管理子系統(tǒng),財(cái)務(wù)系統(tǒng),病案統(tǒng)計(jì)子系統(tǒng)等等,所有子系統(tǒng)都同時(shí)使用一個(gè)大型的數(shù)據(jù)庫(kù),雖然硬件的配置能使系統(tǒng)處理數(shù)據(jù)能力較高,但是同時(shí)進(jìn)行深入分析和統(tǒng)計(jì)時(shí)還是會(huì)降低數(shù)據(jù)處理能力,管理人員分析經(jīng)營(yíng)成果也沒(méi)有方便有效的途徑和方法。要提高分析和決策的效率,必須把分析型數(shù)據(jù)從事務(wù)處理環(huán)境中提取出來(lái),按照分析的需要進(jìn)行重新組織,使用軟件工具來(lái)多方面多層次分析數(shù)據(jù),建立數(shù)據(jù)倉(cāng)庫(kù),應(yīng)用數(shù)據(jù)挖掘正好可以滿足這些要求。
首先在數(shù)據(jù)處理方面,傳統(tǒng)數(shù)據(jù)庫(kù)必須要將每年的數(shù)據(jù)分開(kāi)統(tǒng)計(jì),以提高實(shí)時(shí)的數(shù)據(jù)查詢處理能力。歷史的數(shù)據(jù)連查詢都要分別統(tǒng)計(jì),更不用說(shuō)做深入的分析和應(yīng)用了,而且提供的分析統(tǒng)計(jì)功能基本只能提供簡(jiǎn)單的查詢和統(tǒng)計(jì),需要專業(yè)人員設(shè)置好報(bào)表,才可以對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)。這樣的數(shù)據(jù)庫(kù)技術(shù)已經(jīng)慢慢跟不上醫(yī)院的飛速發(fā)展了。引入數(shù)據(jù)倉(cāng)庫(kù)技術(shù)以后,可以為提升速度,從而對(duì)數(shù)據(jù)進(jìn)拆分。例如可對(duì)當(dāng)月數(shù)據(jù),直接以當(dāng)前的HIS數(shù)據(jù)庫(kù)為數(shù)據(jù)源,只做前臺(tái)數(shù)據(jù)處理和查詢使用,對(duì)隔一段時(shí)期的歷史數(shù)據(jù),定時(shí)導(dǎo)入到數(shù)據(jù)倉(cāng)庫(kù)中,數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)在物理上與在線處理系統(tǒng)分離,這樣做大數(shù)據(jù)量分析的時(shí)候就不會(huì)影響到在線處理系統(tǒng)的運(yùn)行,從而造成死機(jī),服務(wù)器癱瘓等情況,它相當(dāng)于一個(gè)數(shù)據(jù)病案室。將當(dāng)前數(shù)據(jù)源的數(shù)據(jù)在相隔一個(gè)期間以后,提交到數(shù)據(jù)倉(cāng)庫(kù),用來(lái)提供管理分析。并且分析數(shù)據(jù)時(shí)不需要專業(yè)人員事先設(shè)定好報(bào)表,由原來(lái)被動(dòng)的、固定的報(bào)表模式,到現(xiàn)在各級(jí)領(lǐng)導(dǎo)可跟據(jù)自已的想法,從現(xiàn)有的模型中主動(dòng)挖掘出自已想要數(shù)據(jù),能夠充分挖掘醫(yī)院信息系統(tǒng)的信息資源,提高醫(yī)院信息系統(tǒng)的的應(yīng)用分析水平。
其次在分析應(yīng)用方面
1可以對(duì)醫(yī)院醫(yī)療收入狀況進(jìn)行分析,以了解相關(guān)因素對(duì)醫(yī)療收入的影響
例如:以“門診”為主題建立挖掘模型,從門診的掛號(hào)人數(shù),就診時(shí)間,化驗(yàn)檢查次數(shù)、時(shí)間、金額,取藥次數(shù)、金額等方面對(duì)門診病人就診效率進(jìn)行分析,在就診時(shí)間上、手續(xù)上分析,發(fā)現(xiàn)影響就診效率的根本所在,從而提高效率,增加門診收入。例如采用統(tǒng)計(jì)分析方法對(duì)門診病人就診效率進(jìn)行分析。如圖
表1星期情況分布表
表2號(hào)種情況分布表
表3月份情況分布表
通過(guò)這些數(shù)據(jù)分析出影響就診時(shí)間的原因,以改進(jìn)醫(yī)療服務(wù)的質(zhì)量。
2可以對(duì)藥品采購(gòu),儲(chǔ)存,出售,浪費(fèi)情況進(jìn)行分析
以“藥庫(kù)”為主題建立挖掘模型。從出庫(kù)趨勢(shì)、庫(kù)存量、庫(kù)存單位盈利和廠商盈利等四方面進(jìn)行數(shù)據(jù)挖掘和分析。數(shù)據(jù)分析的結(jié)果為醫(yī)院管理者提供管理和經(jīng)營(yíng)方面的決策支持,從而避免出現(xiàn)藥品積壓、藥品無(wú)計(jì)劃采購(gòu)和藥品浪費(fèi)等問(wèn)題
例如采用關(guān)聯(lián)規(guī)則對(duì)藥品的購(gòu)買進(jìn)行分析:(所謂關(guān)聯(lián)規(guī)則,是指數(shù)據(jù)對(duì)象之間的相互依賴關(guān)系,而發(fā)現(xiàn)規(guī)則的任務(wù)就是從數(shù)據(jù)庫(kù)發(fā)現(xiàn)那些確信變和支持度都大于給定值的強(qiáng)壯規(guī)則。)例如:將醫(yī)院2010年10月—2011年九月的藥房發(fā)藥的數(shù)據(jù)作為源數(shù)據(jù)轉(zhuǎn)換后載入數(shù)據(jù)倉(cāng)庫(kù),給定最小支持度為25%和最小可信度60%對(duì)其進(jìn)行關(guān)聯(lián)分析得出藥品的關(guān)聯(lián)度如
Rule1:濃魚(yú)肝油--->枸椽酸鈣surport=0.4542Confidence=0.7323
Rule2:枸椽酸鈣--->濃魚(yú)肝油 surport=0.3041 Confidence=0.5937
Rule3:美托洛爾--->替米沙坦surport=0.3298confidence=0.5892
Rule4:替米沙坦--->美托洛爾Surport=0.4838 Confidence=0.7230
從上述規(guī)則可得出結(jié)論,濃魚(yú)肝油多半會(huì)跟枸椽酸鈣配合使用,而枸椽酸鈣卻不需要同時(shí)配合濃魚(yú)肝油,同樣的,替米沙坦對(duì)美托洛爾的依賴成度也較高。因此在藥品采購(gòu)時(shí)可以根據(jù)得出的關(guān)聯(lián)規(guī)則來(lái)考慮藥品配合使用的問(wèn)題,調(diào)整藥品的庫(kù)存及采購(gòu)數(shù)量。還可以根據(jù)此規(guī)則把相關(guān)的藥品放在相近的藥品架上,提高藥房的發(fā)藥效率。
數(shù)據(jù)倉(cāng)庫(kù)和挖掘應(yīng)用是一個(gè)不斷深入、不斷完善的過(guò)程,完成了一個(gè)主題,一個(gè)應(yīng)用,又會(huì)提出更多的應(yīng)用需求。還可以對(duì)病人信息分析,醫(yī)療信息分析、績(jī)效評(píng)估,疾病的治療方式和成果等方面進(jìn)行更深入的研究和實(shí)踐。從而及時(shí)發(fā)現(xiàn)潛在的病因,疾病的耐藥性和治療周期等等,不僅僅為醫(yī)院,甚至可能為整個(gè)醫(yī)療事業(yè)帶來(lái)令人興奮的成果。
參考文獻(xiàn)
[1]陳京民.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù).北京:電子工業(yè)出版社,2002,95-96.
[2]康曉東.基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘技術(shù)[M].北京:機(jī)械工業(yè)出版社,2004.
[3]李立羽,等.OLAF'關(guān)聯(lián)規(guī)則挖掘[J].計(jì)算機(jī)工程與應(yīng)用,2002.