999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘技術在醫院逃費預測分析中的應用

2009-01-20 01:56:26劉新宇
中國集體經濟 2009年11期

劉新宇

摘要:文章論述了關聯規則以及貝葉斯算法在醫院住院患者逃費預測分析中的實現原理及應用,闡述了屬性權重分析方法、分類分析進行逃費預測的實現。

關鍵詞:商業智能;貝葉斯算法;關聯規則;醫院信息系統。

一、引言

醫院的信息化建設在商業智能領域屬于初級階段,商業智能針對醫院信息系統中所產生的龐大數據,通過BI所提供的各種強大的分析功能進行多角度、多層次的分析,為醫院的科學管理和科學決策提供有價值的信息資源,真正實現醫院全方位智能化管理,這將是醫院信息化的大勢所趨。

二、需求分析

從業務發展角度看,醫院作為救死扶傷的機構承擔著治病救人的社會職責。但另一方面,作為經營性實體,醫療機構同時也要對就診者收費。由于種種原因,不少醫院不同程度地面臨著各式各樣的欠逃費現象,醫療收費難成為不少醫院的隱痛,為此本文將通過數據挖掘技術實現逃費分析預測模型,這是解決這些問題的第一步。縱觀醫院歷年來的逃費記錄來看,每年都有大量的逃費患者,包括急診救治、住院、術后等各種狀況,在現有醫療體制的大環境下,對逃費概率較高的患者需要多加關注,從管理的層面盡可能地將逃費的現狀在一定程度上改善。逃費預測分析主要應用思路就是基于現有的醫院信息系統歷年的數據,采用數據挖掘模型的關聯規則從多方位、多角度形成出逃費的模型,并據此模型對現有住院患者進行逃費分析,并將分析結果提供給護士以及相應管理人員,提供管理依據。

三、設計方案

(一)數據倉庫與數據挖掘

數據倉庫是一種管理技術,它將分布在企業中的異構數據集成在一起,實現數據的采集、歸納和處理,使醫院的業務工作環境和信息分析環境相分離,為數據挖掘的應用奠定基礎。把異構的數據抽取、清理、轉載和更新到數據倉庫中,是醫院數據挖掘應用的基礎。

(二)建立逃費影響因素的關聯模型

1、數據準備和屬性權重分析。數據準備需要做的工作主要為:使用數據提取、轉換和裝載工具基于事務型數據庫建立逃費相關的主題數據倉庫,使用數據有效性過濾方法過濾掉不完整的記錄,使用數字規范化方法把逃費的結果歸納成布爾值(0不逃費,1逃費),在數據處理完畢后,利用Microsoft Naive Bayes算法找出各住院相關的屬性影響逃費的權重。權重是根據對應屬性取不同值時,影響病人逃費的概率統計。其中,權重大于零的屬性被認為是與逃費相關的屬性,權重小于等于零的屬性被認為是對逃費沒有影響的屬性。下文針對權重大于零的屬性,利用關聯規則進行相關性分析。

2、關聯規則基本概念。設I={i1,i2,i3,…,in}是事件全集。設集合D是事件的集合(D?奐I)。A、B是兩個事件,關聯規則是形如A→B的蘊涵式,其中A∈I,B∈I。規則A→B在事件集D中成立,具有支持度s,其中s是D中的事件包含A∪B(A和B同時發生)的概率,記為P(A∪B)。規則A→B在事件集D中具有置信度c,c是在D中包含事件A的條件下也包含B的概率,即條件概率P(B|A)。分別記為:Support(A→B)=P(A∪B)Confidence(A→B)=P(B|A)。

3、Microsoft關聯規則的應用。關聯規則在應用中考慮的是事件的存在與不存在,即布爾值0或1,所以它是布爾關聯規則。根據規則中涉及的數據維可以分為單維關聯規則和多維關聯規則。對于使用關聯規則中的項或屬性每個只涉及一個維的方法,是單維關聯規則。

例1:RA→IsEscape(逃費):表示入院來源為A的病人逃費情況為逃費(其中支持度和置信度省略)。符號說明:RA——入院來源A,HB——戶籍B,MA——醫保類型A,JB——職業類型B,其他類推;下文均符合這個約定。

同樣,對于使用多個維度進行關聯的分析的方法,稱為多維關聯規則。

例2:RA∧HD→IsEscape(逃費):表示入院來源為A并且戶籍屬于D的病人,逃費情況為逃費。

在關聯分析模型中的維數可以任意地進行指定,不過指定的維數與數據挖掘進行的速度是成反比的,而且大于3個維度的置信度將會非常小,模型具有實際意義的可能性很小。表1是一個3個維度關聯分析的運行結果,可以看到不同屬性的組合能夠影響逃費情況的量化判定。以第一行為例:入院來源為A、職業為C并且醫保類型為B的病人逃費的置信度為90.9%,支持度為85.9%。可以看出入院來源為A、職業為C并且醫保類型為B的病人逃費概率比較高(90.9%的逃費概率)。

(三)分類分析進行逃費預測

分類分析是針對離散值進行預測的方法,這個方法的天然特性決定了其適合于解決逃費這個布爾值的預測問題。該方法實現采用Naive Bayes算法,該算法所需的運算量小,能夠快速生成挖掘模型以發現輸入列和可預測列之間的關系。應用分類分析需要三個主要步驟:

第一步:建立預測模型。本例中使用基本屬性作為樣本屬性,同時簡化逃費情況的分類,逃費狀態只分為逃費和不逃費兩類。使用已知分類結果的訓練數據集計算出a式中P(Xk|Ci)和P(Ci)的值(i=1,2;1≤k≤5),這些概率已知后,給任一樣本X就可以根據a式判定出它屬于哪個分類,這樣預測模型就建立了。

第二步:模型準確性的評價。利用同樣已知分類結果的測試數據集來評價第一步中生成的預測模型,即把測試數據集的預測結果和實際情況進行比較,評價的結果為預測矩陣,行標表示實際發生的結果,列標表示預測的結果,對角線上的數據表示預測模型預測正確的次數,數據部分反對角線上的兩個數據是預測結果與實際結果不符的情況發生的次數,同時可以獲得模型的準確程度為97.8%。如果對模型不滿意,可以通過調整貝葉斯方法入口參數值,重新進行第一步,直到獲得滿意的準確度。入口參數即為a式中P(Xk|Ci)的人為設定的最小參考值,當P(Xk|Ci)小于設定的入口參數時,P(Xk|Ci)的值由設定的入口參數值替代,這個參數設置的目的是為了保證樣本屬性k取值為Xk時,把樣本預測為屬于分類Ci的概率,入口參數通常結合屬性權重分析結果設定,入口參數在0-1之間變化。

第三步:預測模型的應用。對模型準確度滿意后,就可以將分類模型應用于應用數據集;這里的應用數據集是醫院住院數據的病人相關資料信息,但是沒有逃費情況的數據集。應用數據集存儲在一個數據表中,把這個數據表中的記錄分別作為預測模型(a式)的輸入預測出病人逃費的結果,可以把預測結果的逃費率與歷史上相同情況的逃費率進行比較,判定某個醫療環節是否需要調整以及優化。或者通過預測模型的準確度和某病人的逃費概率,提前針對逃費病人采取措施,以避免逃費情況的發生。

四、結論與建議

在當前的大環境下,我國與國外的醫療信息化的發展步伐相比,還有很多方面需要建設與完善,尤其是在商業智能的應用領域還處于初級階段狀態下,合理、適時的逃費分析預測系統有現實的建設意義。

參考文獻:

1、段云峰,李劍威,韓潔,宋美娜.數據倉庫基礎[M].電子工業出版社出版,2004.

2、邵峰晶,于忠清.數據挖掘原理與算法[M].水利水電出版社,2003.

3、韓家煒.數據挖掘概念與技術[M].機械工業出版社,2006.

(作者單位:上海互聯網軟件有限公司)

主站蜘蛛池模板: 亚洲国产精品日韩欧美一区| 男女精品视频| 欧美精品黑人粗大| 91美女在线| 国产精品主播| 高h视频在线| 国产真实自在自线免费精品| 日韩欧美中文在线| 亚洲AV成人一区二区三区AV| 亚洲精品无码抽插日韩| 国产在线专区| 欧美 亚洲 日韩 国产| 午夜视频免费试看| 国产91久久久久久| 亚洲人免费视频| 国产女主播一区| 国产在线自揄拍揄视频网站| 欧美19综合中文字幕| 国产精品极品美女自在线| 精品久久国产综合精麻豆| 亚洲人成网站在线播放2019| 综合社区亚洲熟妇p| 亚洲国产天堂久久九九九| 国产色婷婷视频在线观看| 国产精品香蕉在线观看不卡| 国产网友愉拍精品| 99re精彩视频| 手机精品视频在线观看免费| 91国内在线视频| 一级福利视频| 国产成人综合亚洲网址| 国产亚洲精品97AA片在线播放| 无码区日韩专区免费系列| 亚洲欧美自拍中文| 91九色最新地址| 日韩免费视频播播| 国产产在线精品亚洲aavv| 国产视频 第一页| 97国产精品视频自在拍| 日韩不卡高清视频| 成人va亚洲va欧美天堂| 中文字幕乱码二三区免费| 国产精品福利社| 欧美黄色网站在线看| 国产99精品久久| 中国毛片网| 最新国产你懂的在线网址| 亚洲中文无码av永久伊人| 成人午夜视频在线| 伊人丁香五月天久久综合| 久久亚洲天堂| a欧美在线| 中文字幕在线看| 国产在线精品99一区不卡| 国产91av在线| 欧美一级夜夜爽| 国产99视频精品免费观看9e| 日韩国产另类| 国产成人福利在线| 黄色成年视频| 美女裸体18禁网站| 色综合手机在线| 99久久精彩视频| 国产主播在线一区| 国内老司机精品视频在线播出| 国产香蕉国产精品偷在线观看| 婷婷六月色| 真实国产乱子伦高清| 好紧太爽了视频免费无码| 波多野结衣一区二区三区88| 蜜臀av性久久久久蜜臀aⅴ麻豆| 亚洲狠狠婷婷综合久久久久| 97狠狠操| 欧美成人aⅴ| 色婷婷在线播放| 又黄又湿又爽的视频| 亚洲香蕉在线| 亚洲日韩第九十九页| 片在线无码观看| 久久亚洲精少妇毛片午夜无码| 久久网欧美| 麻豆a级片|