999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于GWO-SVR 的冠心病住院費用預測

2020-03-24 03:49:08席歡歡
智能計算機與應用 2020年11期
關鍵詞:冠心病優化模型

張 慧,賀 松,張 碩,黃 旭,席歡歡

(1 貴州大學 大數據與信息工程學院,貴陽 550025;2 貴州大學 醫學院,貴陽 550025)

0 引言

隨著健康中國戰略的不斷推進,人們更加注重醫療衛生建設,全面提高全民健康水平已成為各方關注的焦點。但就目前來看,中國醫療費用持續攀升,“看病難,看病貴”依然是醫療衛生事業改革的痛點和難點[1]。冠心病是全球死亡率最高的疾病之一,據世界衛生組織2011 年的報告指出,中國的冠心病死亡人數已列世界第二位,且發病呈年輕化趨勢[2]。因此,研究冠心病住院費用的增長趨勢,分析影響病人住院費用的顯著影響因素,運用機器學習算法對住院費用進行精準預測,對協調提升全民健康水平和合理控制醫療費用增長具有重大意義。

支持向量機(Support Vector Machine,SV 是M)對于非線性問題具有較強的擬合能力,簡單且泛化能力好,有較強的魯棒性[3]。但通常在選取最優核函數時,存在許多隨機性,經常無法達到良好的預測效果[4]。目前常用的參數優化算法主要有:差分進化算法(Genetic Algorithms,DE)[5]、粒子群優化算法(Particle Swarm Optimization,PSO)[6]和布谷鳥搜索算法(Cuckoo Search,CS)[7]等。本文采用2014年Mirjalili 等提出的灰狼算法GWO(Grey Wolf Optimizer)[8],對SVM 回歸模型進行參數優化。相較于上述幾種優化算法,灰狼優化算法無論在參數尋優速度方面,還是在預測住院費用擬合效果上都具有突出表現。

1 理論方法

1.1 GWO 優化算法

1.1.1 基本原理

GWO 優化算法的本質就是模擬大自然灰狼群體中嚴格的等級制度和狩獵行為。通過把灰狼群體劃分成α、β、δ、ω4 個等級,向獵物進行前進搜索,并依次作為最優解、次優解、次次優解和底層進行數學建模的過程。如圖1 所示。

圖1 GWO 灰狼群體等級分類Fig.1 GWO grey Wolf group classification

1.1.2 GWO 優化算法狩獵過程

GWO 優化算法是一種通過模仿狼群包圍、追捕、攻擊3 大步驟而形成狩獵行為過程。

(1)包圍獵物。當灰狼一旦發現獵物,便會迅速向獵物靠近。灰狼與獵物間的距離以及灰狼位置的更新可由式(1)、式(2)得到。

式中,d代表搜索空間維度;t代表灰狼當前的迭代次數;X(t)代表第t代灰狼位置向量;XiP(t)代表第t代獵物所在位置向量,即全局最優解向量;D代表灰狼與獵物之間的距離向量,A和C代表的是系數向量,由式(3)~式(5)得到。

式中,tmax代表最大迭代次數;a在迭代過程中線性從2 下降至0;r1與r2均為[0,1]上的隨機變量。

(2)追捕獵物。狼群進行狩獵行為,通常是按照其適應度大小進行排序。可以依次獲取到α 狼的位置,即最優解Xα;β 狼的位置,即次優解Xβ;δ狼的位置,即次次優解Xδ。

α、β、δ、ω 灰狼的實時位置更新公式由式(6)~式(8)得到。

式中,X1、X2、X3依次代表灰狼α、β、δ 的實時更新位置,X(t+1)代表更新后的最優解向量。灰狼算法最優解的更新過程如圖2 所示。

圖2 GWO 算法最優解向量更新過程Fig.2 GWO algorithm optimal solution vector update process

(3)攻擊獵物。當獵物停止移動時,灰狼便開始發起進攻。進攻行為的發起主要是通過式(3)中a迭代次數,從而間接控制式(4)中A的取值來完成的。當|A |≤1 時,灰狼群對獵物進行攻擊,對應局部搜索;當|A |>1 時,灰狼群將遠離獵物散去,再次進行全局搜索。

1.2 支持向量機回歸

支持向量機回歸(SVR),是支持向量機(SVM)的重要應用分支之一,它是通過SVM 方法進行擬合曲線,做出相應的回歸分析的模型[9]。其核心思想是尋找到一個回歸平面,使得一個集合內所有的實驗數據距離該平面的距離最近。

SVR 主要是通過給定不敏感損失函數ε,采用適合的核函數,進行樣本訓練。通過對懲罰因子c和核函數中的方差g的計算,獲取到不為0 零的參數所對應的支持向量,繼而通過訓練樣本進行建模,并利用該模型對測試樣本進行預測的過程[10]。

式(9)中,ω代表權向量,b代表偏置向量。

式(10)中引入的是拉格朗日函數及松弛變量。C 代表SVR 模型的懲罰因子,用其來表達超出誤差ε的懲罰程度;K(X,Y)代表SVR 模型的核函數。SVR 的回歸模型由式(11)得到:

2 基于GWO-SVR 的預測模型構建

在SVR 回歸預測中,懲罰因子c和核函數g的選取,將直接影響支持向量機的預測擬合效果。為進一步提高模型的準確率,需要借助灰狼優化算法,獲取最優參數Bset_c 和Best_g,再進行SVR 回歸預測。

GWO-SVR 預測模型的構建過程如下:

步驟1讀取某二甲醫院冠心病727 份病案首頁數據進行預處理。按照比例隨機劃分數據集,最終生成650 份訓練集數據和77 份測試集數據,并對所有數據進行歸一化處理。

步驟2設置GWO 算法參數。種群規模設置為N,最大迭代次數設置為T;設定懲罰系數C和核函數方差g取值范圍。

步驟3初始化狼群位置,即每個灰狼的個體位置均由懲罰系數c和核函數參數g的值決定。

步驟4計算每頭狼相應的適應度,按照適應度函數值大小排序。

步驟5將灰狼群劃分成α、β、δ、ω4 個等級。

步驟6根據公式(6)~公式(8)更新灰狼群中每個個體的位置;將灰狼新位置適應度與上一次迭代的適應度進行比較,判斷是否替換適應度。

步驟7判斷當前迭代次數是否為t≥T。若是,輸出全局最優值Best_c 和Best_g;否則,跳轉至步驟四,繼續進行參數優化。

步驟8輸出α灰狼位置,即得到最優的Best_c 和Best_g 參數。

步驟9通過最優的參數Best_c 和Best_g 建立SVR 回歸模型,通過測試集進行預測,分析實驗結果。

GWO-SVR 實現的流程圖如圖3 所示。

圖3 灰狼算法優化SVR 參數流程圖Fig.3 Gray Wolf algorithm to optimize the flow chart of SVR parameters

3 實驗結果分析

3.1 數據來源

本研究選用了某二甲醫院冠心病病人的病案首頁數據,共計743 例。該數據能夠最直觀的反映冠心病病人在診療過程中最真實有效的費用。經過對目標樣本進行數據清洗,缺失項填補、刪除信息不全及不符合邏輯項共計16 例,共納入有效項727 例,納入率為97.84%。

3.2 住院費用影響因素分析

通過對727 份冠心病住院費的住院年份、患者年齡、入院途徑、并發癥合并癥級別、是否手術等多個因素進行多重回歸分析,結果證明:回歸方程模型具有統計學意義(F=545.336,P=0.000),方程決定系數R2=0.892。說明住院費用89.2%的變異可由表1 中9 個變量解釋。其中對冠心病住院費用影響最大的前3 位因素分別為:是否造影檢查、是否手術、特級護理時間。

3.3 數據預處理及參比模型

將727 份病案首頁數據按照9 ∶1 的比例,隨機劃分成650 份訓練集和77 份測試集數據。實驗中將上述9 大顯著影響住院費用的因素作為輸入數據,將住院費用作為輸出數據。由于醫院病案數據因病人而異,變化幅度相對較大,有時具有突變性,而SVR 模型對[0,1]的數據又非常敏感,所以在建模之前,需要借助對病案數據進行歸一化處理,以此來提高回歸模型的效率。歸一化方法如式(12):

表1 住院影響因素的多重回歸分析Tab.1 Multiple regression analysis of influencing factors of hospitalization

為了驗證GWO-SVR 模型對冠心病住院費用預測的準確性和有效性,本文除了與原始SVR 模型形成對照外,還通過與差分進化算法優化的DESVR 模型、布谷鳥算法優化的CS-SVR 模型和粒子群優化算法的PSO-SVR 模型形成對照模型,進行了比較分析。

為公平起見,將SVR 參數取值范圍設置為:c∈[1,100],g∈[1,100];所有優化算法的種群個數設為20,最大迭代次數設為20。其中,CS 的縮放因子上界為0.8,下界為0.2,交叉概率為0.2;PSO 的c1=c2=1.5。

3.4 實驗結果分析

圖4、圖5 分別描述了在原始SVR 模型和GWO-SVR 模型下測試集的預測結果。

圖4 SVR 模型下的預測集預測Fig.4 Prediction set prediction under the SVR model

圖5 GWO-SVR 模型下的預測集預測Fig.5 Prediction set prediction under the GWO-SVR model

由圖可以清晰地看到,在灰狼算法的優化下,SVR 回歸模型能夠更好的對預測集數據進行預測。為了驗證本文所提出的GWO-SVR 模型的有效性和準確性。表2 給出了不同優化算法模型對懲罰因子Best_c 和核函數方差Best_g 的尋優結果。

通過均方誤差MSE、決定系數R2、SVR參數迭代尋優時間T3 個指標,評價不同模型的回歸預測性能。詳盡數據見表3。

表2 不同優化算法下的Best_c 和Best_gTab.2 Best_C and Best _g under different optimization algorithms performance

表3 不同模型下的回歸預測指標Tab.3 Regression prediction indexes of different models

通過表3 的結果可以發現,原始SVR 模型參數尋優速度較慢,而上述4 種優化算法均可以顯著提升參數尋優速度;另外CS-SVR、PSO-SVR、GWOSVR3 種預測模型相較于原始SVR 模型,對均方誤差MSE、決定系數R2都有一定的提升。而DE-SVR預測模型的均方誤差和決定系數R2不降反升,有可能是參數設置原因,但參數尋優時間相較于原始SVR 模型被明顯縮短。總體來說,本文所引入的的GWO-SVR 模型表現最佳,不僅使預測結果的均方誤差最小,還具有較強的全局空間搜索能力,在SVR 參數尋優時僅需要1.16 s 就可以得到最理想的(c,g)解向量,決定系數R2相較于原始SVR 模型也具有最明顯的提升,有效提高了冠心病住院費用的預測精度。

4 結束語

本文通過多重回歸分析和歸一化處理,分析出影響住院費用的顯著影響因素的同時,又提高了SVR 模型對數據的敏感性,為進一步提高冠心病住院費用預測的精度。本研究引入灰狼算法,對支持向量機回歸的懲罰因子C 和核函數方差g 進行進一步尋優,算法的全局搜索能力顯著提升。GWO 可以迅速鎖定SVR 中最優(C,g),因此在進行預測模型的搭建時,住院費用的預測結果得到了很大的提升。通過與原始SVR 模型、DE-SVR、CS-SVR、PSOSVR 的形成對照模型發現,基于灰狼算法優化的SVR 模型表現最佳,均方誤差僅為0.004 0,參數尋優迭代速度最快僅需1.16 s、在決定系數R2上也由原來的0.865 2 顯著提升至0.961 3。

猜你喜歡
冠心病優化模型
一半模型
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
ADAMTs-1、 CF6、 CARP在冠心病合并慢性心力衰竭中的意義
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
茶、汁、飲治療冠心病
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
警惕冠心病
智慧健康(2019年36期)2020-01-14 15:22:58
主站蜘蛛池模板: 欧美国产日产一区二区| 成人福利在线视频| 国产污视频在线观看| 色九九视频| 久久网欧美| 无码高潮喷水在线观看| 天天综合亚洲| 黄色国产在线| 青青草原国产免费av观看| 免费观看无遮挡www的小视频| 亚洲国产亚综合在线区| 色综合综合网| 午夜免费小视频| 天堂va亚洲va欧美va国产| 国产色伊人| 久久久国产精品免费视频| 国产在线观看人成激情视频| 亚洲天堂2014| 全裸无码专区| 久久男人资源站| AV不卡在线永久免费观看| 伊人蕉久影院| 99精品久久精品| 亚洲精品免费网站| 日韩在线成年视频人网站观看| 日韩东京热无码人妻| www.91中文字幕| 国产欧美精品一区二区 | 国产精品成人久久| 亚洲色婷婷一区二区| 久久精品国产免费观看频道| 日本一区高清| 无码 在线 在线| 日韩AV无码免费一二三区| 日本不卡在线视频| 国产区在线观看视频| 亚洲经典在线中文字幕| 欧美午夜在线观看| 国产97区一区二区三区无码| 日韩人妻无码制服丝袜视频| 一级黄色网站在线免费看| 久精品色妇丰满人妻| 91精品国产综合久久香蕉922 | 亚洲精品卡2卡3卡4卡5卡区| 青青草原国产免费av观看| 国产黄色爱视频| 熟妇人妻无乱码中文字幕真矢织江| 免费大黄网站在线观看| 99久久国产综合精品2023| 日本黄色a视频| 9啪在线视频| 在线永久免费观看的毛片| 欧美亚洲一二三区| 欧美97色| 亚洲 日韩 激情 无码 中出| 国产精鲁鲁网在线视频| 国产精品性| 久久一色本道亚洲| 在线国产91| 亚洲水蜜桃久久综合网站| 亚洲精品国产日韩无码AV永久免费网| 国产成人欧美| 中文字幕在线播放不卡| 99精品热视频这里只有精品7| 亚洲人成人无码www| 91在线激情在线观看| 狠狠做深爱婷婷综合一区| 黄色a一级视频| 久久99久久无码毛片一区二区| 久久熟女AV| 一本大道香蕉中文日本不卡高清二区| 丁香婷婷激情网| 色综合综合网| 97综合久久| 亚洲婷婷丁香| 国产精品毛片一区视频播| 99国产在线视频| 99精品国产电影| 欧美精品综合视频一区二区| 一级片免费网站| AV老司机AV天堂| 91在线免费公开视频|