999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Microsoft時序挖掘模型在門診掛號預測中的應用

2012-03-11 14:01:22劉炳麟王志萍
中國衛生統計 2012年4期
關鍵詞:數據挖掘模型

劉炳麟 王志萍

對時間序列數據進行分析的目的是為了預測未來。其分析方法有多種,本文介紹作為分析方法之一的Microsoft時序挖掘模型,在Excel環境下實現對時間序列數據的分析預測。本文將展示它在門診掛號預測中的應用效果,可以作為醫院門診部制定工作計劃、合理安排人、財、物資源的科學依據。

Microsoft時序算法

Microsoft時序算法是Microsoft SQL Server 2008 A-nalysis Services(SSAS)提供的回歸算法,用于創建數據挖掘模型以便對預測方案中的連續列(如門診掛號人次)進行預測。Microsoft時序算法包括兩個獨立的算法:ARTXP算法和ARIMA算法。ARTXP算法針對短期預測進行了優化,因此可預測序列中下一個可能的值,ARIMA算法針對長期預測進行了優化。

默認情況下,Microsoft時序算法在分析模式和進行預測時混合使用這兩種算法。該算法使用相同的數據為兩個單獨的模型定型:一個模型采用 ARTXP算法,另一個模型采用ARIMA算法。因為ARTXP最適合于短期預測,所以在一系列預測的開始時十分重要。但是,隨著預測的時間段不斷向將來延伸,ARIMA就比較重要了。在進行前幾步預測時只使用ARTXP,完成前幾步預測后,結合使用ARIMA和ARTXP,隨著預測步驟數的增加,預測越來越多地依賴 ARIMA,直至不再使用 ARTXP。

1.ARIMA

自回歸移動平均模型(ARIMA),是由Box和Jenkins于20世紀70年代初提出的時間序列預測方法,基本思想是:將預測對象隨時間推移而形成的數據序列視為一個隨機序列,用一定的數學模型來近似描述這個序列,這個模型一旦被識別后就可以從時間序列的過去值及現在值來預測未來值。ARIMA數學模型由自回歸(AR)模型和滑動平均(MA)模型組合而成,數學公式表示為:

Yt= φ1Yt-1+ φ2Yt-2+ … + φpYt-p+et- θ1et-1-θ2et-2- … - θqet-q

p為自回歸模型的階數,Yt是時間序列在t期的觀測值,et是時間序列模型在t期的誤差或偏差。

2.ARTXP

ARTXP結合了自動回歸技術和決策樹技術。在自動回歸過程中,x在t的值(xt)是時間t之前的x一系列值的一個函數,例如 xt=f(xt-1,xt-2,xt-3,…,xt-n)+εt,其中xt是待研究的時間序列,n是自動回歸的階,通常小于該序列的長度,最后一項代表噪聲。使用時間序列算法的目標是找到這個函數f。如果函數f是一個線性函數,則有如下的形式,xt=a1xt-1+a2xt-2+a3xt-3+…+anxt-n+εt,其中ai是自動回歸系數。使用Microsoft時序算法創建的模型是一個自動回歸模型,在該模型中,函數f對應一棵回歸樹。回歸樹按照屬性拆分,相當于決策樹,樹的葉節點對應一個回歸公式,用于創建數據挖掘預測模型。

ARTXP派生自以下事實,即自動回歸樹方法(一種ART算法)應用于多個未知的先前狀態。ART算法的優點是所需資料不多,可用自變量數列來進行預測。但是這種方法要求數據必須具有自相關。

Excel環境下應用Microsoft時序挖掘模型

首先,下載Excel 2007數據挖掘加載項:SQL Server 2008 Data Mining Add-ins for Microsoft Office 2007,將Excel 2007數據挖掘加載項安裝到計算機中。打開Excel 2007,可以發現菜單欄中增加了一個“數據挖掘”菜單。

真正使用此數據挖掘加載項,還需要滿足如下條件:(1)計算機操作系統為Windows XP SP2以上或Windows 7等;(2)計算機中安裝有SQL Sever 2008。

以下介紹使用Microsoft時序挖掘模型:

1.連接數據挖掘服務器和Analysis Services數據庫

因為Microsoft時序挖掘模型工作模式是客戶端和服務器模式即 C/S模式,Excel作為客戶端,SQL Sever 2008作為提供數據挖掘模型和提供數據的服務器端,所以必須首先連接SQL Sever本地服務器,即在本機中安裝SQL Sever 2008時設定的服務器名稱,連接服務器的同時要連接到創建好的Analysis Services數據庫,通過此數據庫可以為數據挖掘模型提供要分析的數據。在通過點擊連接子菜單中的“選擇連接”,彈出一個對話框,單擊對話框中的“新建”,輸入服務器名稱和已創建的Analysis Services數據庫。

創建Analysis Services數據庫有兩種方式。一種是通過SQL Sever 2008創建多維數據倉庫時創建,這種方式往往是為了分析多維數據倉庫中的數據,即數據來自多維數據倉庫。另一種是通過Excel 2007數據挖掘實例創建,在前面所述安裝Excel 2007數據挖掘加載項時,微軟提供了一個實例,通過Window XP的“開始”→“程序”→Microsoft SQL 2008數據挖掘外接程序→服務器配置實用工具,來創建一個Analysis Services數據庫,但是此數據庫只有結構,沒有數據,是空的。這種方式用來分析來自于Excel工作表中的數據,即把要分析的數據輸入工作表中進行分析。

2.數據準備

本文數據來自上面所敘述的第一種方式。通過SQL Sever 2008創建了我院門診掛號數據倉庫,門診掛號的原始數據存儲在此數據倉庫中,新的數據不斷增加到數據倉庫中。在數據倉庫中建立掛號數據立方體,此立方體包括兩個維度,時間維度和門診科室維度,一個事實表,門診掛號人次事實表。

利用Excel的數據透視表作為數據立方體的數據前端展示工具。單擊Excel 2007的“數據”菜單→獲取外部數據子菜單中的“自其他來源“→”來自Analysis Services”,在彈出的對話框中輸入前面所述的服務器名稱,選擇所要分析的Analysis Services數據庫,將數據立方體的數據導入,以數據透視表的方式展示在Excel工作表中。本文選擇了2008年至2011年上半年的歷史掛號數據,來預測未來的2011年7月的掛號數據,分別選取了8個專業門診。

Excel工作表中時間序列數據的格式要求為:第一列為時間數據,要有標題,時間格式,例如2008年1月應為200801或2008/1;其他列,標題列為科室名稱,例如東院兒科門診、東院耳鼻喉門診等,數據為數字,例如各門診科室的掛號人次。

3.創建時序模型

用鼠標單擊“數據建?!弊硬藛沃懈呒墸瑔螕簟皠摻ㄍ诰蚪Y構”,將導入到工作表中的幾列數據選定作為創建挖掘結構的源數據,將Excel工作表中的時間數據列作為Key Time列。給創建的挖掘結構輸入名稱,保存。單擊“將模型添加到結構”,選擇剛剛創建的挖掘結構名稱,在算法中選擇“Microsoft時序”,將要預測的列改為僅預測,例如將標題為東院兒科門診、東院耳鼻喉門診等的數據列改為僅預測。最后輸入模型名稱,保存。

4.瀏覽時序模型

通過“瀏覽”功能菜單,可實現瀏覽創建好的時序模型。本文通過預測8個專業門診2011年7月的掛號人次,顯示Microsoft時序挖掘模型預測效果。圖1為“瀏覽”后的預測效果。

圖1 預測趨勢圖

圖1中虛線為預測的部分,選擇【顯示偏差】復選框,可顯示偏差范圍,現以預測2011年7月以上幾個專業門診的掛號人次為例,展示預測效果。預測值和實際值比較見表1,東院免疫風濕門診、東院神經科門診、東院肝膽外科門診預測值非常接近實際值,其他專業門診實際值在預測偏差范圍內,僅東院泌尿外預測值偏離了實際值,這是因為期間更換了科主任,有更多病人慕名而來??梢钥闯鰰r序挖掘模型能較好地完成預測任務,為醫院決策提供可靠的依據。

表1 2011年7月掛號人次實際值和預測值

Microsoft時序挖掘模型為醫院管理者提供了一種決策工具,不僅用于預測門診掛號人次,還可以預測科室收入、醫院總收入、藥庫出入庫數量等。

1.呂效國,劉凱峰,王占軍.用自回歸模型的預選方法預測門診人數.中國衛生統計,2009,26(1):64.

2.Box GEP,Jenkins GM,Reisel GC.顧嵐主譯.時間序列分析-預測與控制.北京:中國統計出版社,1997:5-180.

3.謝邦昌,朱建平,來升強.Execl 2007數據挖掘完全手冊.北京:清華大學出版社,2008:175-197.

4.朱凌云,等.醫學數據挖掘技術、方法與應用.生物醫學工程雜志,2003,20(3):559-562.

5.孫振球.醫學統計學.第2版.北京:人民衛生出版社,2007:461-477.

猜你喜歡
數據挖掘模型
一半模型
探討人工智能與數據挖掘發展趨勢
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
3D打印中的模型分割與打包
一種基于Hadoop的大數據挖掘云服務及應用
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
主站蜘蛛池模板: 日韩不卡免费视频| 日韩精品一区二区三区大桥未久| 欧美午夜小视频| 中文字幕 欧美日韩| 深爱婷婷激情网| 影音先锋丝袜制服| 日本三级欧美三级| 日韩免费成人| 少妇被粗大的猛烈进出免费视频| 日本伊人色综合网| 色天堂无毒不卡| 99久久精品国产自免费| 波多野吉衣一区二区三区av| 国产欧美日韩18| 香蕉综合在线视频91| 亚洲中文字幕av无码区| 国产精品无码制服丝袜| 亚洲成A人V欧美综合天堂| 亚洲视频无码| 日韩欧美网址| 伊人成色综合网| 亚洲欧美在线精品一区二区| 老色鬼久久亚洲AV综合| 国内视频精品| 日韩AV无码一区| 熟女成人国产精品视频| 欧美狠狠干| 国产一区亚洲一区| 欧美日韩一区二区在线播放| 国产在线精品99一区不卡| lhav亚洲精品| 国产69囗曝护士吞精在线视频| 美女无遮挡免费视频网站| 国产日本一线在线观看免费| 波多野结衣无码视频在线观看| 久久精品丝袜| 色亚洲成人| 久久福利片| 青青热久免费精品视频6| 色网站在线视频| 亚洲无码高清一区| 中国一级毛片免费观看| 久草网视频在线| 大乳丰满人妻中文字幕日本| 亚洲无码37.| 国产不卡一级毛片视频| 亚洲天堂精品视频| 国产精品页| 免费观看无遮挡www的小视频| 欧美97欧美综合色伦图| 永久免费无码日韩视频| 波多野吉衣一区二区三区av| 国产精品分类视频分类一区| 久草国产在线观看| 国产欧美在线| 激情无码字幕综合| 日韩性网站| 日韩人妻少妇一区二区| 欧美一区精品| 国产尤物jk自慰制服喷水| 免费国产小视频在线观看| 日韩欧美色综合| 四虎永久免费网站| 亚洲天堂啪啪| 97av视频在线观看| 亚洲美女操| 免费在线看黄网址| 91热爆在线| 国产成人AV大片大片在线播放 | 无码精油按摩潮喷在线播放| 一本大道无码日韩精品影视| 国产精品污视频| 国产午夜福利在线小视频| 国产午夜无码片在线观看网站 | 在线色综合| 国产特级毛片aaaaaa| 午夜不卡视频| 波多野结衣第一页| 97在线观看视频免费| 国产成人一区二区| 国产后式a一视频| 国产成人禁片在线观看|