999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于粒子群優化算法隨機森林模型的體外沖擊波治療泌尿系統結石療效預測研究

2023-03-27 02:42:00王祖銘李永剛馬雪中方舸
醫療裝備 2023年5期
關鍵詞:模型

王祖銘,李永剛,馬雪中,方舸

1 南京理工大學計算機科學與工程學院(江蘇南京 210018);2 南京中醫藥大學附屬醫院(江蘇南京 210029);3 南京中醫藥大學附屬醫院紫東院區(江蘇南京 210046)

泌尿系統結石是泌尿外科的常見病與多發病,其發病率在泌尿外科住院患者中占據首位[1-2]。2020 年《中國泌尿外科和男科疾病診斷治療指南》[3]發布的泌尿系統結石流行病學調查顯示,中國成年人泌尿系統結石發病率為1%~5%,年新發率為(150~200)/10 萬人,與美國、泰國一起被列為世界上3 大結石高發區[2]。體外沖擊波碎石的原理是在X 線或超聲影像定位下將聲透鏡聚焦的沖擊波導入體內,覆蓋結石,結石在一定沖擊波能量下受到多種沖擊波效應的影響而發生裂解、粉碎[4]。經過40 多年的發展,目前我國二級及以上中、西醫醫院及專科醫院基本都配置了專業的體外沖擊波碎石設備,隨著設備的不斷改進和經驗的不斷積累,體外沖擊碎石治療技術日臻成熟,成為目前臨床治療直徑小于20 mm 或表面積小于300 mm2泌尿系統結石的標準方法[3]。目前,在我國現行醫保體系下,體外沖擊波碎石治療并未被列入住院手術項目,而是門診治療項目,由患者全額自費承擔治療費用,這意味著患者可能面臨因不適用體外沖擊波碎石治療而導致碎石失敗,不僅使其承受健康、時間及經濟方面的多重損失,還可能會因此引發醫患糾紛。因此在泌尿系結石患者進行取石治療前,快速、科學、有效地對患者體外沖擊波碎石治療效果及并發癥進行分析和預測,不僅可以使患者更直觀、更充分地了解治療方式及其利弊,而且可以最大限度地避免患者損失,降低醫療服務成本,具有重要的臨床指導意義。基于此,本研究提出一種粒子群優化算法隨機森林(particle swarm optimizationrandom forest,PSO-RF)模型,并用于體外沖擊波治療泌尿系統結石的療效預測,以期為體外沖擊波治療泌尿系統結石提供新的選擇和思路。

1 資料與方法

1.1 一般資料

選取2018 年至2021 年1 江蘇省中醫院泌尿外科確診的原發性泌尿系統結石患者1 150 例為研究對象,其中男871 例,年齡8~81 歲,平均(44.38±13.54)歲,女279 例,年齡7~90 歲,平均(46.31±14.08)歲。本研究納入的研究對象均符合《中國泌尿外科和男科疾病診斷治療指南》[3]中的確診和分類標準,其中,左輸尿管上段結石患者247 例,左腎下盞結石患者185 例,右輸尿管上段結石患者181 例,右腎下盞結石患者119 例,左輸尿管下段結石患者100 例,右輸尿管下段結石患者78 例,左腎盂結石患者54 例,其他結石患者186 例。本研究為回顧性研究,不涉及倫理、患者個人信息及隱私等安全問題。

1.2 方法

本研究中,治療設備采用Dornier Lithotripter S Ⅱ體外沖擊波碎石機。

1.2.1 隨機森林模型

集成學習是機器學習中的一種大類,其基本思想是將多個分類器組合,從而構建一個預測效果更佳的集成分類器。集成算法大致可分為3 種類型:Bagging、Boosting 和Stacking。機器學習包括回歸和分類兩種任務,而隨機森林(random forest,RF)可以同時勝任這兩種任務。其中,分類任務是對離散值進行預測,回歸任務是對連續值進行預測[5-6]。

在RF 中,個體學習器采用決策樹(decision tree,DT)算法,該算法性能的優劣對RF 的學習能力具有重要影響。DT 的生成就是遞歸構建二叉樹的過程,本研究通過基尼指數最小化準則進行特征選擇,生成二叉樹。定義訓練數據集為D,回歸樹為f(x),生成算法如下。

第一步,選擇最優切分變量j與切分點s,遍歷變量j,計算。

記錄達到最小值時的對應位置(j,s)。

第二步,用選定的對應位置(j,s)劃分區域,并決定相應的輸出值。

第三步,重復第一步和第二步,直至滿足停止條件。

第四步,將輸入空間劃分為M 個區域R1、R2……RM,生成DT。

第五步,重復第一步至第四步,直至生成RF。

基尼指數可以選擇最優特征,同時決定該特征的最優二值切分點。基尼指數表示集合D 的不確定性,基尼指數越大,樣本的不確定性越大。

則在特征A 的條件下,定義集合D 的基尼指數為:

1.2.2 粒子群優化算法

粒子群優化算法(particle swarm optimization,PSO)最初是受自然界鳥群捕食行為啟發而提出的能夠在全局范圍內較好地進行參數尋優的集群智能尋優算法。在數學上,將鳥群的覓食空間抽象為所研究問題的潛在解的空間,該空間為N維,空間內粒子數為n,整個空間內的全部粒子X={x1,x2,x3,…,xn},某個問題的潛在解為第i個粒子的位置xi,每個粒子都知道自己目前為止發現的最好位置,即最優解pbesti和當前解,若當前解優于個體記錄的歷史最優解,則更新最優解pbesti為當前解。同時,個體也知道整個群體中所有粒子發現的最優解gbesti。若個體當前解優于群體最優解gbesti,則更新gbesti。粒子的運動由自身和群體的歷史經驗,以及當前位置決定[7-8]。粒子通過下列公式更新自己的速度和位置,速度計算公式如下:

其中i=1,2,…,N,N為群體中粒子的總數,即所研究問題的潛在解的個數。

在公式(5)中,ω 為慣性權重,表示上一代粒子的速度對當代粒子速度的影響,一般隨著進化過程的線性遞減;c1和c2為學習因子,通常都取固定值2,r1和r2是兩個介于[0,1]的隨機數,c1*r1*(pbesti-xi)代表粒子從當前位置指向歷史最優位置的矢量,反映了粒子的自身經驗對其運動行為的影響;c2*r2*(gbesti-xi)代表粒子從當前位置指向群體最好位置的矢量,反映了粒子間的信息共享。

ω 值越大,探索新區域的能力越強,全局尋優能力越強,但是局部尋優能力越弱。反之,全局尋優能力越弱,局部尋優能力強。較大的ω 有利于全局搜索,跳出局部極值,不至于陷入局部最優;而較小的ω 有利于局部搜索,使算法快速收斂到最優解。因此ω 不宜為固定常數,在粒子優化過程中一般采用線性遞減權值策略,一般初始化為0.9,遞減到0.4,如公式7 所示。

其中,Gk為最大迭代次數,ωini為初始慣性權值,ωend為迭代至最大進化代數時的慣性權值。

1.2.3 PSO-RF 模型優化過程

RF 模型中很多參數的組合可實現局部最優,不同的選擇組合直接影響整個模型的建立和分類效果。在模型的建立、訓練和預測過程中,使用的樣本數據通常為隨機選擇,常規條件下,RF 缺少特定的規則選擇辦法,多數使用經驗論。本研究將PSO 優化算法融入RF 模型,對RF 模型中的參數進行迭代計算,并快速選擇適用于RF 模型的優化參數,以提高RF 模型的訓練和識別效率。

引入Kappa系數,評估模型輸出結果的一致性和有效性。對于分類問題,Kappa系數用于表述分類模型的精確度,Kappa系數越大,模型的分類精度越高,定義Kappa系數為:

其中,Po表示總體分類精度,Pe表示各類別對應的預測值樣本數與真實值樣本數的乘積,在數值上,Pe可表述為:

其中,αi表示第i類的樣本數量,βi表示預測為第i類的正確樣本數量,c表示分類類別數,n表示樣本個數。

Kappa系數作為適應度值,其優化過程如下:

第一步,初始化。隨機設定一組粒子種群,初始化位置和速度,迭代次數,終止條件,在特定的范圍內隨機選擇Kappa。

第二步,計算每個粒子的適應度值。

第三步,將粒子當前位置設置為初始個體極值,取適應度值最大的粒子對應的個體極值,作為最初的全局極值。

第四步,計算迭代第m次更新的位置和速度,分別為xi和vi,個體極值PmBest={PmBest1,PmBest2,PmBest3,…,PmBesti},從該個體極值中尋求最優極值,作為全局最優極值P mBest,并與第m-1 次迭代的P(m-1)gBest進行比較,如果更優,則更換,否則保留P(m-1)gBest為PmgBest不變。

第五步,更新粒子位置和速度;根據PSO 理論對新粒子的位置和速度進行計算和更新,包括慣性權重,學習因子等。

第六步,根據Kappa系數和迭代次數判斷是否滿足終止條件,若滿足終止條件,則結束循環,否則跳轉至第二步。

第七步,運用最佳超參數,重新構建新的RF模型。PSO-RF 模型流程如圖1 所示。

圖1 PSO-RF 模型流程圖

1.2.4 模型預測性能評價指標

各模型通過訓練集訓練獲得最終預測模型后,需要用測試集對模型的性能進行評估,以體現模型對新數據的預測效果。常見的模型預測性能評價指標有識別準確率、AUC、精確率、召回率及F1 分數,對所建立的預測模型和粒子群優化算法優化后的模型進行性能評價。定義TP 為真正例,即實際為正,預測為正;FP 為假正例,實際為負,但預測為正;FN 為假反例,實際為正,但預測為負;TN 為真反例,實際為負,預測為負。則準確率、AUC、精確率、召回率及F1 分數計算方法如公式(10)所示。

其中,AUC等于ROC 曲線在假正例率的積分。

2 結果

2.1 模型求解

使用PSO 算法對RF 模型進行優化,其實質在于對RF 模型的決策樹個數、決策樹最大深度、葉子節點最小樣本數、節點劃分最小樣本數進行優化求解。隨機劃分70%的樣本集,作為模型求解數據集,剩余30%的樣本集作為下文的測試集。PSO-RF 模型的具體構建方法和步驟為:首先,將求解數據集隨機10 等分,取5 折交叉驗證的Kappa系數作為適應度函數;其次,隨機生成RF決策樹個數為100、決策樹最大深度為5、葉子節點最小樣本數為50、節點劃分最小樣本數為0;再次,將RF 節點分裂評價準則選擇gini 函數,劃分時考慮的最大特征比例選擇auto 模式,節點劃分不純度的閾值設定為0;最后,在PSO 算法模型中,設置初始粒子種群數為50,粒子種群的維度D 計算為39,最大迭代次數設置為150 次,慣性權重設置為0.9,個體學習因子和群體學習因子均為2。PSO-RF 模型建立和求解的過程如圖2 所示。最終經PSO 算法優化后的RF 模型最優參數值如下:決策樹個數為142、決策樹最大深度為10、葉子節點最小樣本數為26、節點劃分最小樣本數為0。

圖2 最優適應度個體隨機森林參數變化

2.2 基于PSO-RF 模型對體外沖擊波治療泌尿系統結石療效的預測結果

對納入本研究的1 150 例患者按照7∶3 的比例隨機分為訓練集和測試集。選取傳統神經網絡(back propagation,BP)[9-10]、支持向量機(support vector machine,SVM)[11]、決策樹(decision tree,DT)[12-13]進行建模,以及本研究提出的PSO-RF模型對目標患者標簽進行分類預測,通過虛擬化操作統一數據量綱,以數據集70%的數據量作為各算法的訓練集,其余30%作為模型測試集。選取分類預測準確率、AUC、精確率、召回率及F1 分數作為模型輸出表現的評價指標,并使用MATLAB 2019a 對各模型進行搭建、訓練和測試,記錄真正例、假正例、假反例及真反例的個數,并計算各模型的預測準確率、精確率、召回率及F1分數,如表1所示。

表1 各模型對體外沖擊波治療泌尿系統結石療效的預測結果

由表1 可知,PSO-RF 模型對體外沖擊波治療泌尿系統結石療效的預測準確率相比BP 神經網絡模型、SVM 模型及DT 模型分別提高了4.3%、6.9%及11.0%,相比SVM 模型及DT 模型,差異有統計學意義(P<0.05);PSO-RF 模型對體外沖擊波治療泌尿系統結石療效預測的召回率相比BP 神經網絡模型、SVM 模型及DT 模型分別提高了6.7%、9.1%及13.7%,差異有統計學意義(P<0.05);PSORF 模型對體外沖擊波治療泌尿系統結石療效預測的精確率相比BP 神經網絡模型、SVM 模型及DT模型分別提高了5.2%、14.5%及13.2%,相比SVM模型及DT 模型,差異有統計學意義(P<0.05);PSO-RF 模型對體外沖擊波治療泌尿系統結石療效預測的F1 分數相比BP 神經網絡模型、SVM 模型及DT 模型分別提高了4.1%、12.1%及10.3%,相比SVM 模型及DT 模型,差異有統計學意義(P<0.05)。繪制BP 神經網絡模型、SVM 模型、DT 模型及PSO-RF 模型的ROC 曲線,如圖3 所示,計算各模型曲線的AUC分別為0.65、0.71、0.63 及0.74,PSO-RF 模型對體外沖擊波治療泌尿系統結石療效的預測價值較BP 神經網絡模型、SVM 模型及DT 模型更高。

圖3 各模型的ROC 曲線

2.3 各模型時間復雜度的比較

使用70%的樣本集對各模型進行訓練,重復該過程20 次,并記錄BP 神經網絡模型、SVM 模型、DT模型及PSO-RF模型對訓練集訓練使用的時間,如圖4 所示。PSO-RF 模型對體外沖擊波治療泌尿系統結石患者的訓練時間相比BP 神經網絡模型降低,差異有統計學意義(t=9.81,P<0.05)。

圖4 各模型時間復雜度的比較

3 討論

泌尿系統結石的成因比較復雜,至今仍未明確。根據現有的結石治療指南所規范的體外沖擊波治療的適應證和禁忌證,以及近些年體外沖擊波治療泌尿系結石療效的研究,一些研究機構與醫院臨床雖然自身已經建立了一套預測方法[14-17],但在目前的臨床實踐中,大部分醫師受限于技術、經驗等因素,仍無法根據這些指南推測體外沖擊波治療的成功率,無法合理制訂體外沖擊波碎石方案,并預估術后并發癥的發生概率等。而且體外沖擊波碎石治療成功與否,取決于治療前后的數十種因素,這些因素之間的關系及對體外沖擊波碎石療效的影響尚未完全明確[18-20],因此結合數據挖掘技術的計算機輔助預測體外沖擊波療效具有重要臨床意義。

本研究針對泌尿系統結石臨床治療過程中的痛點、難點等問題,提出了一種基于PSO 算法優化RF 模型的預測方法。該方法將RF 模型中的決策樹個數、決策樹最大深度、葉子節點最小樣本數及節點劃分最小樣本數進行優化求解,該過程既保留了RF 模型準確率高,還引入了隨機性,且具備不容易過擬合、抗噪聲能力強等特點,又兼顧了PSO算法的優點,極大地提高了RF 模型的效率。通過泌尿系統結石患者的年齡、身高、體重、性別、結石位置、結石大小、體外沖擊次數等特征值進行無監督訓練學習,PSO-RF 模型對體外沖擊波治療泌尿系統結石治療效果的預測準確率、精確率、召回率、F1 分數、AUC分別為84.0%、85.6%、81.4%、78.8%及0.74,相比傳統BP 神經網絡模型、SVM 模型及DT 模型,PSO-RF 模型具有更高的預測準確率、召回率、精確率、F1 分數和AUC,對體外沖擊波治療泌尿系統結石效果具有更高的預測價值,可為體外沖擊波治療泌尿系統結石提供新的選擇和思路。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 日本国产在线| 夜色爽爽影院18禁妓女影院| 伊人久久大香线蕉影院| 日韩成人在线一区二区| 亚洲精品中文字幕无乱码| 国产a v无码专区亚洲av| 久久夜色精品| 污视频日本| 无码高潮喷水专区久久| 国产免费怡红院视频| 操美女免费网站| 国内精品91| 欧美性久久久久| 欧美精品xx| 国产精品 欧美激情 在线播放| 成人va亚洲va欧美天堂| 亚洲自拍另类| 日本www色视频| 国内丰满少妇猛烈精品播| 久久99精品久久久久纯品| 色综合久久综合网| 狠狠躁天天躁夜夜躁婷婷| 91精品亚洲| 久久影院一区二区h| 人妻丰满熟妇啪啪| 99人妻碰碰碰久久久久禁片| 久久精品国产精品一区二区| 国产女人综合久久精品视| 亚洲一区精品视频在线| 97视频精品全国免费观看| 自拍偷拍欧美日韩| 欧美成人二区| 国产精品永久不卡免费视频| 亚洲一本大道在线| 一级毛片在线免费视频| 91香蕉视频下载网站| 国产jizzjizz视频| 国产精品成人一区二区| 亚洲午夜福利在线| 国产00高中生在线播放| 免费观看成人久久网免费观看| 成人亚洲视频| 久久一日本道色综合久久| 亚洲系列无码专区偷窥无码| 日韩精品免费一线在线观看 | 国产91视频免费| 国产麻豆另类AV| 久久免费观看视频| 亚洲国产精品VA在线看黑人| 麻豆精品视频在线原创| 午夜欧美理论2019理论| 91视频首页| 久视频免费精品6| 亚洲成人高清无码| 人妻精品久久无码区| 欧美福利在线| 91免费精品国偷自产在线在线| 免费无码一区二区| 欧美一区二区福利视频| 欧美天天干| 亚洲婷婷丁香| 午夜影院a级片| 欧美日本中文| 国产va欧美va在线观看| 亚洲天堂成人在线观看| 国产a网站| 国产一区二区三区免费| 亚洲日韩精品无码专区97| 麻豆国产精品视频| 综合人妻久久一区二区精品 | 亚洲成人在线免费观看| 欧美一区二区人人喊爽| 毛片免费高清免费| 日本午夜影院| 亚洲男人天堂2020| 99热这里只有成人精品国产| 国产精品久久精品| 成年网址网站在线观看| 青草视频在线观看国产| 色婷婷成人| 国产成人一区二区| 亚洲国产精品成人久久综合影院 |