沈旴亮(南京醫(yī)科大學(xué)附屬南京婦幼保健院,210004)
基于數(shù)據(jù)挖掘技術(shù)的醫(yī)院信息管理系統(tǒng)分析
沈旴亮
(南京醫(yī)科大學(xué)附屬南京婦幼保健院,210004)
隨著目前我國(guó)信息技術(shù)的快速發(fā)展,醫(yī)院信息化建設(shè)已經(jīng)成為一項(xiàng)十分重要的內(nèi)容,同時(shí)也是建設(shè)現(xiàn)代化醫(yī)院的必要條件。計(jì)算機(jī)技術(shù)的應(yīng)用為醫(yī)院的發(fā)展帶來了新的契機(jī)和機(jī)遇,同時(shí)也為我國(guó)現(xiàn)代化醫(yī)療衛(wèi)生事業(yè)發(fā)展注入了新的活力。本文主要針對(duì)數(shù)據(jù)挖掘技術(shù)及其在醫(yī)院信息管理系統(tǒng)中的應(yīng)用進(jìn)行研究,通過對(duì)數(shù)據(jù)挖掘技術(shù)應(yīng)用必要性的分析進(jìn)一步突出我國(guó)現(xiàn)代化醫(yī)療建設(shè)中數(shù)據(jù)挖掘技術(shù)的重大作用,同時(shí)在此基礎(chǔ)上對(duì)數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息管理系統(tǒng)的應(yīng)用進(jìn)行詳細(xì)分析,以期更好的提升我國(guó)的現(xiàn)代化醫(yī)療水平。
數(shù)據(jù)挖掘技術(shù);醫(yī)院信息管理;現(xiàn)代化醫(yī)療;應(yīng)用
醫(yī)院信息管理系統(tǒng)指的是綜合不同的計(jì)算機(jī)、網(wǎng)絡(luò)、通信等現(xiàn)代化技術(shù)手段實(shí)現(xiàn)對(duì)醫(yī)院內(nèi)相關(guān)人員、物資以及資金的管理。同時(shí)在此過程中要對(duì)相關(guān)活動(dòng)所產(chǎn)生的數(shù)據(jù)進(jìn)行收集、存儲(chǔ)、處理、信息提取以及后期處理等環(huán)節(jié),其目的是為現(xiàn)代化醫(yī)院的建設(shè)以及自動(dòng)化建設(shè)提供必要的信息支持。在目前的醫(yī)院信息管理系統(tǒng)中,可以采集到大量的醫(yī)院臨床和醫(yī)院管理方面的信息,然而如何實(shí)現(xiàn)對(duì)這些數(shù)據(jù)信息的深層次挖掘、進(jìn)一步發(fā)現(xiàn)這些信息中潛在的價(jià)值是當(dāng)前醫(yī)院信息管理系統(tǒng)中一個(gè)至關(guān)重要的環(huán)節(jié)。與此同時(shí),目前的數(shù)據(jù)挖掘技術(shù)對(duì)于數(shù)據(jù)的深層次分析有著較大的優(yōu)勢(shì),因此可以借助于數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)對(duì)醫(yī)院信息管理系統(tǒng)采集信息的深度分析,以獲取更多有利于醫(yī)院進(jìn)一步發(fā)展的信息,進(jìn)一步提升醫(yī)院的整體水平和經(jīng)濟(jì)效益。
數(shù)據(jù)挖掘技術(shù)是當(dāng)前數(shù)據(jù)分析和處理領(lǐng)域一項(xiàng)十分重要的技術(shù),具體而言數(shù)據(jù)挖掘技術(shù)可以看成是信息技術(shù)不斷發(fā)展和演進(jìn)的結(jié)果,是在人們對(duì)于數(shù)據(jù)庫(kù)技術(shù)不斷發(fā)展和創(chuàng)新的基礎(chǔ)上發(fā)展而來的。在初期階段,商業(yè)數(shù)據(jù)往往只是簡(jiǎn)單的進(jìn)行存儲(chǔ),然后有了對(duì)相關(guān)數(shù)據(jù)的查詢功能,再繼續(xù)發(fā)展為對(duì)相關(guān)數(shù)據(jù)的即時(shí)遍歷。數(shù)據(jù)挖掘技術(shù)使得數(shù)據(jù)查詢已經(jīng)不僅僅局限于數(shù)據(jù)本身,同時(shí)還可以通過相關(guān)的算法和技術(shù)發(fā)現(xiàn)數(shù)據(jù)之間潛在的關(guān)聯(lián)性,從而在很大程度上增加了數(shù)據(jù)利用的深度和層次。隨著當(dāng)前大數(shù)據(jù)時(shí)代的到來以及高性能計(jì)算機(jī)和數(shù)據(jù)挖掘算法的成熟,數(shù)據(jù)挖掘技術(shù)開始在商業(yè)領(lǐng)域進(jìn)行應(yīng)用,并且取得了快速的發(fā)展。在目前的醫(yī)院信息管理系統(tǒng)中已經(jīng)積累了大量的數(shù)據(jù)信息,因此如何實(shí)現(xiàn)對(duì)這一部分信息的深層次數(shù)據(jù)挖掘是至關(guān)重要的,這也將直接決定著醫(yī)院將來的發(fā)展和命運(yùn)。在醫(yī)院信息管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)可以在更深層次上對(duì)醫(yī)院的管理數(shù)據(jù)進(jìn)行分析,從而可以為醫(yī)院從業(yè)人員的相關(guān)決策、管理以及研究提供更加有力的技術(shù)支持。因此數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息管理系統(tǒng)中的應(yīng)用具有十分重要的意義。
在目前的數(shù)據(jù)挖掘技術(shù)中,其關(guān)鍵技術(shù)是數(shù)據(jù)的預(yù)處理。當(dāng)需要進(jìn)行分析的數(shù)據(jù)庫(kù)包含大量的噪聲或者存在數(shù)據(jù)不一致性時(shí),數(shù)據(jù)預(yù)處理就顯得更加有必要。根據(jù)對(duì)相關(guān)數(shù)據(jù)挖掘過程的統(tǒng)計(jì)顯示,超過一半的時(shí)間用于進(jìn)行數(shù)據(jù)預(yù)處理,而真正用于數(shù)據(jù)信息挖掘的時(shí)間則僅占到10%左右。目前的數(shù)據(jù)預(yù)處理技術(shù)主要分析對(duì)數(shù)據(jù)的清洗、集成、轉(zhuǎn)換以及消減等。另一關(guān)鍵技術(shù)是匿名化以及轉(zhuǎn)換技術(shù),這主要是由于在目前的醫(yī)院信息管理中涉及到病人的隱私問題,因此在進(jìn)行數(shù)據(jù)處理的同時(shí)需要對(duì)患者的相關(guān)記錄進(jìn)行匿名化處理,以更好的保護(hù)患者的個(gè)人隱私。(XY)大于支持集,并且置信度大于最小置信度,此時(shí)XY可以稱之為強(qiáng)規(guī)則,否則將其稱之為弱規(guī)則。在數(shù)據(jù)挖掘的過程中,尋找強(qiáng)規(guī)則是整個(gè)數(shù)據(jù)挖掘過程的關(guān)鍵。在強(qiáng)規(guī)則XY所對(duì)應(yīng)的項(xiàng)集中,必定存在著頻集。
基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘模型如圖1所示,其中主要包括數(shù)據(jù)集D、關(guān)聯(lián)規(guī)則搜索算法、數(shù)據(jù)挖掘結(jié)果R以及用戶與數(shù)據(jù)挖掘之間的交互,對(duì)相關(guān)的數(shù)據(jù)挖掘結(jié)果信息結(jié)果進(jìn)行合理的評(píng)價(jià)。在實(shí)際的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘過程中還需要考慮到以下兩個(gè)方面的問題:其一,盡量減少I/O操作的次數(shù),這主要是由于數(shù)據(jù)挖掘過程中的數(shù)據(jù)量是非常大的,因此頻繁的進(jìn)行I/O操作將會(huì)對(duì)數(shù)據(jù)挖掘的效率產(chǎn)生很大的影響,其根本的方法就是減少對(duì)于數(shù)據(jù)庫(kù)集的掃描頻率和次數(shù);其二,避免候選集中項(xiàng)的數(shù)量過大,這主要是由于過多的項(xiàng)數(shù)將會(huì)使得存儲(chǔ)空間被大量占用,從而對(duì)數(shù)據(jù)挖掘的效率產(chǎn)生影響。
2.1基于數(shù)據(jù)挖掘技術(shù)的醫(yī)院信息管理系統(tǒng)
2.2基于數(shù)據(jù)挖掘技術(shù)的醫(yī)院信息管理系統(tǒng)的實(shí)現(xiàn)
關(guān)聯(lián)規(guī)則是目前進(jìn)行數(shù)據(jù)挖掘的重要手段,在醫(yī)院信息管理系統(tǒng)中引入關(guān)聯(lián)規(guī)則可以進(jìn)一步發(fā)現(xiàn)數(shù)據(jù)之間的相互關(guān)聯(lián),并且在對(duì)病人的相關(guān)數(shù)據(jù)的分析和進(jìn)一步挖掘過程中,嘗試分析患者年齡與醫(yī)療費(fèi)用之間潛在的關(guān)聯(lián),并且進(jìn)一步通過這種關(guān)聯(lián)關(guān)系加強(qiáng)對(duì)醫(yī)院資源的合理優(yōu)化配置,實(shí)現(xiàn)對(duì)不同年齡段患者的醫(yī)療費(fèi)用的有效控制,進(jìn)而實(shí)現(xiàn)醫(yī)院效益的最大化。具體而言,將關(guān)聯(lián)數(shù)據(jù)集合記為D={t1,t2,...tn},tk={i1,i2,im..ip},tk為數(shù)據(jù)庫(kù)中的事務(wù),im為數(shù)據(jù)庫(kù)中的項(xiàng)。在數(shù)據(jù)集合D中,其包含的集X的項(xiàng)數(shù)為集的支持?jǐn)?shù),將其記為σx,支持度為support(X),則有support(X)=σx/|D|×100%。假設(shè)X和Y為數(shù)據(jù)庫(kù)集合D中的項(xiàng)集,則有:假如XY,則有X項(xiàng)的支持度大于Y項(xiàng)的支持度,同時(shí)假如X是非頻繁項(xiàng),則此時(shí)Y項(xiàng)也是非頻繁;則假如Y項(xiàng)是頻繁的,則X項(xiàng)也是頻繁的。在數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則中有兩個(gè)至關(guān)重要的概念,即支持度與置信度。通常而言,支持度只要用于衡量采用的關(guān)聯(lián)規(guī)則的可信度,而置信度則用于表示在生成數(shù)據(jù)集中關(guān)聯(lián)規(guī)則的統(tǒng)計(jì)角色。在實(shí)際的應(yīng)用過程中,假如support
(1)數(shù)據(jù)準(zhǔn)備階段
在研究過程中采用某醫(yī)院信息管理系統(tǒng)中的口腔潰瘍數(shù)據(jù)進(jìn)行挖掘分析,其中數(shù)據(jù)準(zhǔn)備階段主要包括集成、清洗以及轉(zhuǎn)換三個(gè)階段。具體而言,數(shù)據(jù)集成主要是將不同的患者數(shù)據(jù)表格及其費(fèi)用數(shù)據(jù)整合到一起,并且對(duì)這些原始數(shù)據(jù)進(jìn)行集成,將其集成到統(tǒng)一的數(shù)據(jù)表格中,其中主要包含患者的性別、年齡以及編號(hào)等信息。其具體的表格如表1所示。

表1 數(shù)據(jù)集成表格

圖1 基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘模型
數(shù)據(jù)清洗指的是對(duì)原始數(shù)據(jù)進(jìn)行進(jìn)一步的處理,其目的是去除原始數(shù)據(jù)中的噪聲以及不相關(guān)信息、補(bǔ)充遺漏數(shù)據(jù)、去除白噪聲等,并且根據(jù)實(shí)際情況完成對(duì)原始數(shù)據(jù)的轉(zhuǎn)換。同時(shí),由于醫(yī)院信息數(shù)據(jù)存在著其特殊性,醫(yī)院的數(shù)據(jù)往往產(chǎn)生于不同的場(chǎng)所,因此其產(chǎn)生的過程較為復(fù)雜,這就極易導(dǎo)致數(shù)據(jù)產(chǎn)生的過程中出現(xiàn)遺失或者出現(xiàn)數(shù)據(jù)錯(cuò)誤的情況,因此數(shù)據(jù)清洗階段對(duì)于醫(yī)院數(shù)據(jù)挖掘工作是至關(guān)重要的,同時(shí)為了更好的保證數(shù)據(jù)清洗階段的準(zhǔn)確性可以實(shí)行專業(yè)醫(yī)護(hù)人員監(jiān)督的模式,此種模式可以有效的降低數(shù)據(jù)清洗過程中的差錯(cuò)。
數(shù)據(jù)轉(zhuǎn)換是針對(duì)數(shù)據(jù)的不同特征對(duì)數(shù)據(jù)進(jìn)行有效的轉(zhuǎn)換,其中主要的手段包括對(duì)數(shù)據(jù)的規(guī)格化處理、數(shù)據(jù)信息歸納、旋轉(zhuǎn)等。結(jié)合實(shí)際的醫(yī)院信息管理系統(tǒng)數(shù)據(jù)挖掘案例,可以對(duì)年齡數(shù)據(jù)信息進(jìn)分段編號(hào)處理,以更好的提高數(shù)據(jù)挖掘的效率。同時(shí),在數(shù)據(jù)轉(zhuǎn)換的過程中還可以將一些沒有意義的數(shù)據(jù)進(jìn)行刪減,以更好的保證數(shù)據(jù)挖掘的效率,同時(shí)還可以降低數(shù)據(jù)挖掘的誤差。
現(xiàn)代化醫(yī)療事業(yè)發(fā)展關(guān)系到國(guó)計(jì)民生,在我國(guó)的社會(huì)主義發(fā)展過程中占到舉足輕重的位置。而信息化程度的提升對(duì)于推動(dòng)現(xiàn)代化醫(yī)療事業(yè)發(fā)展具有十分重要的意義,基于數(shù)據(jù)挖掘的醫(yī)院信息管理系統(tǒng)能夠有效的提升醫(yī)院資源配置水平、提升醫(yī)院效益。
[1] 周雪.數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息管理中的應(yīng)用[J]電腦知識(shí)與技術(shù),2014第4期
[2] 王慧.數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘在醫(yī)院信息系統(tǒng)中的應(yīng)用[J].電腦開發(fā)與應(yīng)用,2014年第01期
[3] 史今馳.數(shù)據(jù)挖掘技術(shù)在醫(yī)院信息系統(tǒng)中的應(yīng)用[J].中國(guó)醫(yī)療設(shè)備,2013年第13期
[4] 任玉騫.醫(yī)院信息管理系統(tǒng)的應(yīng)用[J].科技致富向?qū)В?012年第06期
The hospital information management system based on Data Mining Technology
Shen Xuliang
(Maternal and Child Health Hospital Affiliated to Nanjing Medical University,Nanjing,210004)
With the current rapid development of information technology,hospital information technology has become a very important element,which is also a necessary condition for the construction of a modern hospital.Application of computer technology for the development of the hospital has brought new opportunities and opportunities,but also for the development of our modern medical and health undertakings injected new vitality.This article focused on data mining technology and its application in the hospital information management system.To further highlight the need for a major role in the modernization of medical data mining techniques of construction,the application of data mining techniques was analyzed.On the basis,detailed analysis of the data mining technology in hospital information management system has been done,in order to better enhance our modern medical standards.
data mining;hospital information management;modern medical;application